t 

( 



(12) NACH DEM VERTRAG CBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM GEBIET DES 
PATENTWESENS (PCT) VEROFFENTLICHTE INTERNATIONALE ANMELDUNG 



(19) Weltorganisation fur geistiges Eigentum 
Internationales Biiro 

(43) Internationales Verdffentlichungsdatum 
1. Mai 2003(01.05.2003) 




PCT 



(10) Internationale Veroffentnchungsnummer 

wo 03/036507 A2 



(51) Internationale Patentklassifikation'': G06F 15/76 



(21) Internationales Aktenzeichen: 



PCT/EP02/10572 



(22) Internationales Anmeldedatum: 

19. September 2002 (19.09.2002) 



(25) Einreichungssprache: 
(2€) Verdffentlichungssprache: 

(30) Angaben zur PrioritSt: 

101 46 132.1 19. September 2001 
09/967,497 28. September 2001 
PCT/EPOl/11299 

30. September 2001 
PCT/EPOl/1 1593 8. Oktober 2001 
101 54 259.3 5. November 2001 
14. Dezember2001 
18. Januar2002 



Deutsch 



Deutsch 



01129923.7 
02001331.4 
102 06 653.1 
102 06 857.7 
102 06 856.9 
102 07 224.8 
102 07 226.4 
102 08 434.3 
102 08 435.1 
PCT/EP02/02398 
PCT/EP02/02402 
PCT/EP02A)24a3 
102 12 622.4 
102 12 621.6 
102 19 681.8 
02009868.7 
102 26 186.5 
102 27 650.1 
102 36 271.8 
102 36 269.6 
102 36 272.6 
102 38 174.7 
102 38 173.9 
102 38 172.0 



21 
21 

27, 
27 



15.Februar2002 
18. Februar2002 
18. Februar2002 
Februar2002 
Februar2002 
Februar2002 
Februar 2002 
5. Marz2002 
5. Mar2 2002 
5. Marz2002 
21. MMrz2002 
21. Mara 2002 
2. Mai 2002 
2. Mai 2002 
12. Juni 2002 
20. Juni 2002 
7. August 2002 
7. August 2002 
7. August 2002 
21. August 2002 
21. August 2002 
21. August 2002 



(19.09.2001) DE 

(28.09.2001) US 

(30.09.2001) EP 

(08.10,2001) EP 

(05.11.2001) DE 

(14.12.2001) EP 

(18.01.2002) EP 
(15.02.2002) DE 
(18.02.2002) DE 
(18.02.2002) DE 
(21,02.2002) DE 
(21.02.2002) DE 
(27.02.2002) DE 
(27.02.2002) DE 
(05.03.2002) EP 
(05.03.2002) EP 
(05.03.2002) EP 
(21.03.2002) DE 
(21.03.2002) DE 
(02.05.2002) DE 
(02.05.2002) EP 
(12.06.2002) DE 
(20.06.2002) DE 
(07.08.2002) DE 
(07.08.2002) DE 
(07.08.2002) DE 
(21.08.2002) DE 
(21.08.2002) DE 
(21.08.2002) DE 



102 40 022.9 

10240 000.8 
PCT/DE02/03278 

10241 812.8 
PCT/EP02/10084 



27. August 2002 (27.08.2002) DE 

27. August 2002 (27,08.2002) DE 

3. September 2002 (03.09.2002) DE 

6. September 2002 (06.09.2002) DE 



9. September 2002 (09.09.2002) EP 

(71) Anmelder (fiir alle Bestimmmgsstaaten mit Ausnahme 
von US): PACT XPP TECHNOLOGIES AG [DE/DEJ; 
Muthmannstrasse 1, 80939 Munchen (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nurfiir US): VORBACH, Martin 

[DE/DE]; Gotthardstrasse 1 17 a, 80689 MUnchen (DE). 

(74) Anwalt: PIETRUK, Claus, Peter; European Patent At- 
torney, Heirich-Lilienfein-Weg 5, 76229 Karlsruhe (DE). 

(81) Bestimmungsstaaten (national): AE, AG, AL, AM, AT, 
AU. AZ. BA. BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR. 

CU, CZ, DE, DK, DM, DZ, EC, EE, ES, H, GB, GD, GE, 
GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, 
KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, 
MN, MW, MX, MZ, NO, NZ, OM, PH, PL. PT, RO, RU, 
SD, SE, SG. SI. SK, SL, TJ, TM, TN, TR, IT, TZ, UA, UG. 
US, UZ, VC. VN, YU, ZA, ZM, ZW. 

(84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, 
GM, KE, LS. MW. MZ, SD, SL, SZ, TZ, UG, ZM, ZW), 
eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, 
TM), europaisches Patent (AT, BE, BG, CH, CY, CZ, DE, 
DK, EE, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, 
SE. SK, TR), OAPI-Patent (BP, BJ. CP, CG, CI, CM, GA. 
GN. GQ, GW. ML. MR, NE, SN, TD, TG). 

Erklarung gemSB Kegel 4.17: 

— hinsichtlich der Berechtigung des Anmelders, ein Patent zu 
beantragen und zu erhalten (Kegel 4J7 Ziffer ii) fiir die 
folgenden Bestimmungsstaaten AE, AG, AL, AM, AT, AU, 
AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, 
CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, 

[Fortsetzung auf der nSchsten Seite] 



^ (54) Title: RECONHGURABLE ELEMENTS 
® (54) Bezeichnung: REKONRGURIERBARE ELEMENTE 

vo 

(57) Abstract: The invention relates to a cell element field for data processing with function cell for carrying out algebraic and/or 
logical functions and memory cells for the receipt, storage or giving out of information. Pertaining to the above, a control connection 
is run from the function cells to the memory cells. 



(57) Zusammenfassung: Die Erfindung betrifft ein Zellementefeld zur Datenverarbeitung mit Funktionszellen zur Ausfiihrung al- 

gebraischer und/oder logischerFunktionen und Speicherzellen, urn Information zu empfangen, abzuspeichem und/oderauszugeben. 
Hierbei ist voigesehen dass von den Funktionszellen eine Steuerverbindung zu den Speicherzellen gefuhrt ist. 



wo 03/036507 A2 liliilliliiliilillillliillililllllinil 



GM, HK HU, ID, IL, IN. IS, JP, KE, KG, KP, KR, KZ, LC, 
LK, LR, LS, LT, LV, LV, MA, MD, MG, MK, MN, MW, MX, 
M2, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG. SI, SK, 
SL, TJ, TM, IN, TR, IT, TZ, UA, UG, UZ, VC, VN, YU, ZA, 
ZM, ZW, ARIPO-Patent (GH, GM, KE, LS, MW, MZ. SD, 
SL, SZ, TZ, UG, ZM, ZW), eurasisckes Patent (AM, AZ BY, 
KG, KZ, MD, RU, TJ, TM), europaisches Patent (AT, BE, 
BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, IE, IT, 
LU, MC, NL, PT, SE, SK, TR), OAPI-Patent (BF, BJ, CF, 
CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG) 



VerdfTentlicht: 

— ohne internationalen Recherchenbericht und erneut zu 
verqffenilichen nach Erhalt des Berichts 



Zur Erklarung der Zweibuchstaben-Codes und der anderen 
Abkurzungen wird airf die Erkldrungen ("Guidance Notes on 
Codes and Abbreviations") am Arfangjeder reguldren Ausgabe 
der PCT-Gazette verwiesen. 



wo 03/036507 



PCT/EP02/10572 



5 



10 



Titel: ReTconf igurierbar e Elemente 

15 



Definitionen 

20 Rekonf igurierbar e Elexnente werden abhSngig von der auiszuffUirenden Applikation 
Tinterschiedlich und applikationsentsprechend ausgestaltet. 

Die Aufgabe der Erfindting besteht darin, Neues fOr die gewerbliche Anwendung 
berei t zus tel I en . 

25 

Die LGsung der Aufgabe wird unabhangig beansprucht. Bevorzugte 
AusftUirungsformen finden sich in den IKiteransprtlchen . 

Unter einer rekonf igurierbar en Architektur werden vorliegend Bausteine (VPD) 
30 xnit konf igurierbarer Punktion und/oder Vemetzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- Oder mehrdimensional 
angeordneten arithmetischen und/oder logischen und/oder analogen \md/oder 
speichemden und/oder intern/extern vemetzenden Baugruppen, die direkt Oder 
durch ein Bussystem zniteinander verbunden sind. 

35 

Zur Gattting dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
xind/oder logischen Zellen iind/oder kommunikativen/peripheren Zellen <I0) , 
Vemetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. 

Hingewiesen wird insbesondere in diesem Zusammenhang au£ die folgenden 
Schutzrechte und Aimeldungen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088,2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 

1 
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07 872.2 , D£ 101 39 170.6 , DG 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 

S Offenbanongszwecken vollumfclnglich eingegliedert. 

Die o.g. Architektur wird beispielhaft zur Verdeutlichxing herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Vemetzungszellen 

10 und/oder komtnunikativen/peripheren (10) Zellen (PAEs) , die zu einer ein- Oder 
mehrdimensionalen Matrix (PA) angeordnet sein kSnnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussysteme werden dabei als Zellen verstanden. Der Ilatrix als ganzes Oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT, Ladelogik) , die 

15 die Vernetzung iind Funktion de8 PA konfigurier t . Die CT kcuin z. B. als 

dedizierte Einheit gem. PACT05, PACTIO, PACT17/ ausgestaltet sein Oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Stsnikturen sind nach dem Stand der Technik bekannt. Die 
gebrduchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soli au£ die belcannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Dmfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeHuon) , KressArrays (Kress, Uni Kaiserslautem) , XPOTER (Hartenstein, Uni 
30 Kaiserslautem) , sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die fOr alle vorgenannten 
Strukturen nubzbar sind, verbessem die Nutzbarkeit der Architekturen und 
PAE- Strukturen in komplexen insbesondere auch stark sequent! ellen und/oder 
35 wenig datenf lufiorientierten Anwendungen. Weiterhin wird der Anschlufi an 
exteme Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogenisiert . 

40 

Indirekte Konf igurat ion 

In einer besonderen Ausftihrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (RRAM) , vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist einen eigenen intemen Seguenzer auf oder ist xait einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limi tier ten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen m5glichen Befehlen, 
ahnlich wie bei RISC-Prozessozren \md/oder bevorzugt vollstandigen 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Worten wird 
bevorzugt ein RISC Prozessor mit einem m^^glichst kleinen Befehlssatz, der 
jedoch berechnungstheoretisch vollst&idig ist, verwendet. In einer 
Ausftlhrungsvariante kann der Sequenzer auch durch eine Konf igaration einer 
S Oder mehrerer PAEs gebildet werden. Es kann der Sequenzer in seiner Funktion 
uxid seinem Ablaufverhalten konfigurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera (ALTERA Data Book 1993]). Der Sequenzer /Microcontroller kann auf 
Zustcbade (z.B, Statussignale, Ereignisse) in der IPAE und/oder auf Zusttode 

10 (z.B. auch Trigger) anderer PAKs, die mit der IPAE verbunden sind (z.B. liber 
ein Bussystem) , reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konfiguriert, z. B. kann der PrograinPointer Rpp 
kann wdhrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den dixrch den Pointer referenzierten 

15 Speicherinhalt aus dem RRAM und schreibt diesen (oder einen Teil dessen) 
entweder in ein, beispielsweise durch den SIpeicherinhalt adressiertes, 
Konf igurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion fOr eine nSchste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der fiblichen Arbeitsweise von Adresspointern 

20 inkrementiert und/oder dekrementiert und/oder bei Sprungbefehlen (JUMP, CALL, 
RETURN) neu gesetzt. Insoweit stellt der Speicher RRAM einen Codespeicher \md 
in einer bevorzugten Ausftihr\ing auch Datenspeicher ftir einen Sequenzer zur 
VerfOguing und/oder wird als solcher genutzt. Der Sequenzer Icann frel Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten AusfQhrung auch Da ten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofem stellt der 
Speicher auch einen Datenspeicher ftir den Sequenzer dar. 

Der RRAM Speicherinhalt kann von einer tibergeordneten Konf igurationseinheit 
(CT) geladen werden. In einer erweiterten Ausftihrung kann der Speicherinhalt, 
30 ggf . auch von der XPAE selbstcbidig, zusatzlich oder altemativ aus einem 

suideren (beispielsweise extemen) Speicher geladen oder an diesen geschrieben 
werden, z.B. tLber einen AnschluS an ein Frontend. 

In einer Ausftlhrungsvariante kann der Speicher und/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein extemes RAM und/oder exteme 10 besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kann der EXTBUS (iber eine, 
ggf. dedizierte, Verbindung des PAE-Bus systems an eine Interface-Baugruppe 
(lOAG) wie beispielsweise aus PACT03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von Speicher (RAM) und/oder Perijdierie (10) erfolgt dabei 
40 bevorzugt durch die Inter f ace-Baugiruppe . 

In einer besonders bevorzugten Ausgestaltung kann der RRAM selbstfindig Code 
\md/oder Da ten ftir den Sequenzer tiber den EXTBUS aus dem oder einem exteroen 
RAM laden. Diese Funktion kann durch eigensttadige, im RRAM implementierte 
45 Oder implement ierbare Adressgeneratoren realisiert werden. Beispielsweise 

eignen sich DMA-Kontroller besonders far diese Aufgabe, indem sie blockweise 
Daten zwischen den Speichem kopieren. Der Adressraum der zu lesenden Daten 
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und der Zieladressraum wird entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kazm durch die IPAE erfolgen. 

In einer hardwaremasig aufwendigeren LOsung kann die Funktion durch eine 
5 implementierte MemoryManagemenUnit (MMQ) realisiert sein, deren allgemeine 
Funktionsweise durch den Stand der Technik per se definlert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMU hier wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 
10 aufgeteilt. Jede Page enthait Daten eines virtuellen Speicherraumes innerhalb 
eines extemen Speichers. Bei spiel sweise k5nnen die hexadezimalen RRAM- 
Adressen OxOaOO. .OxOaff Daten des extemen Speichers an den Adressen 
0xbdl3200. .0xbdl32£f enthalten. Zur Verwaltung der Adressximsetzung wird eine 
Adresslibersetzungseinheit verwendet, die vorzugsweise durch in der RRAH-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die ist nun dazu 

vorgesehen,insbesondere einen groSen Speicherraum au£ den sehr viel 
Kleineren des RRAM zu tU3ersetzen. Dies geschieht vorliegend derart, dass 
Seiten je nach Bedarf von dem grofien Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht mehr bendtigt wird, kcum diese geltischt 
20 und/oder tiberschrieben werden. Wenn die Daten auf der Seite verStadert wurden, 
wird die Seite bevorzugt vor dem L0schen/t)berschreiben in den groSen 
Spei cherrr aum zurtlckgeschr i eben . 

Die Adressuxnsetzungseinheit arbeitet dann derart, dass ein h&herwertiger Tail 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Lookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 

zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAM) verftigbar ist. 

Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 

auch keine Referenz eingetragen. Xn diesem Fall zmjss die Seite erst von 
30 einem grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu 3cann 

eine andere, bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden 

Ablauf Oberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentllche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der MMCJ ein DMA-Kontroller 

angesteuert wird. Die erf ind\ingsgemafie MMU des hier of fenbarten RRAM ist 
daher mit einer Ansteuerung fiXr einen DMA-Kontroller versehen und/oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
extemen RAM, sowie die Seitengrfifie durch die MMU zur VerfUgung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 



In einer mOglichen und applikationsabhSngig ggf . bevorzugten Ausftihrxang 
kOnnen mehrere EXTBUS-Xnterface implementiert sein. 

In einer mGglichen Ausftihrung ist der RRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kOnnen 

4 
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beispielsweise fiir einige der folgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein lond insbesondere eine 6r6&e aufweisen, die. die 
Iinplementierung aller oder einiger der folgenden Funktionen erxn6glicht sowie 
entsprechende Steuerungen, die gegebenenf alls konfigurierbeu: Bind, bevorzugt 
aber fest ixnplementiert sind, besitzen: 

Sequenzer-ZCode-Speicher, Stack (z.B. ftir Registersatz) « Datenspeicher, Heap, 

lO-Puffer, Puffer zu extemem RAM bzw. Cache, Lookup-Tabellen, 
Konfigurationen ftir PAEs und/oder Busse, der Registersatz der IPAE. 
Je nach Funktion kCnnen dazu folgende Ansteuermechanismen vorgesehen und/oder 
konfiguriert sein: 

Sequenzer- /Code- Spei Cher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp), 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z. B. Intel Pentium) per se bekannt ist. 

Konfigurationen fUr PAEs land/oder Busse: Hierauf Icann ein Zeiger innerhalb 
der CT und/oder - ixiqplementierungsabhdngig ein Zeiger innerhalb der 
Konf igurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardware technisch fest vorgeg^benen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt dTirch den Compiler oder Progranunierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszuftlhrende 
Programm imd/oder Betriebssystem und wird innerhalb des Programmes und/oder 
Betriebssystems, ggf . vinter Zuhilfenahme der Regis tersatzes und der ALU des 
Sequenzers, berechnet. 

Der Registersatz der IPAE kann in einer besonderen Ausgestalttmg Shnlich dem 
Registersatz von Transputern als Stack organisiert sein. Dadurch kann der 
Registersatz besonders klein und liardwareteclmisch ef fizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transput ertechnologie bekannt, dass Compiler ef fizient mit einem 
derartigen hardwaretechnisch kostengtinstigen Registersatz corbeiten kdnnen. 
Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer Ausftihrung kann und wird der RRAM als Multi-Port Speicher ausgeftihrt 
sein. Multi-Port Speicher erlaviben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicherzugrif fseinheiten auf den 
Speicherinhalt. Speicherzugrif fseinheiten kJSnnen beispielsweise exteme 
und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die Funktion von 
Multi-Port Speichem ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen AusfUlirung kann die IPAE mit dem RRAM als lokale und ggf. 
auch globale Konf igur at ions einheit ahnlich einer CT ftir PAEs in der Umgebung 
arbeiten oder imter anderem diese Funktion mit erftlllen. Bevorzugt eurbeitet 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit . Wird die PAE als globale 
Konfigurationseizihelt verwendet, oder sind sehr vi el e lokal e PAEs zu 
konf igurieren, wird bevorzugt das Verfahren nach DE 196 54 593.5-53 
5 verwendet, das eine FILMO-Funktionalit&t aufweist und daher sehr viele vind 
auch voneinander unabhSnglge Konfigurationen verwalten kann. 
Die IPAE adressiert, z. B. gesteuert durch den Sequenzer/ 14icrocontr oiler, 
Konfigurationen im RRAM und konfiguriert diese an PAEs und/oder sich selbst 
und/oder bestimmt den Ablauf des Sequenzers/Microcontrollers . Bevorzugt 

10 f indet hierbei eine Synchronisation xnit einer Obergeordneten CT Slhnlich der 
bekannte Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RRAM Schaltung kann Konfiguration tiber eines der 
EXTRAM- Interface selbst laden und/oder Konfigurationen von einer 
iibergeordneten CT tiber das CT Interface anfordern. Die Punktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DE 196 54 846.2-53 sein. Die 
Ronfigurationsdaten tiXr die PAEs werden durch die IRAM an die PAEs 
weitergeleitet Oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren aimlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bus systems verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung ahnlich einem Microcontrollersy-stem, dessen Busanbindung 
iind/oder dessen Daten transfer und/oder dessen Prograiomablauf einem VPU-System 
25 entspricht . 

Es wird insbesondere Schutz fttr IPAE-RRAM-Verschaltungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonf igurierbaren Bausteins ausgestaltet sind irnd typischerweise 
30 beliebige Verschaltungen und Funktionen ausftthren ktSnnen, aber jedoch 

speziell zvm Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konfiguriert und verwendet werden kiJnnen. Die 
Konfiguration erfolgt dabei bevorzugt durch die tSbergeordnete 
Konf igurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fiir PAEs, die zusatzlich zu ihrem Anschluss 
an die intemen Bussysteme des Arrays aus PAEs einen dedizierten Anschluss 
(10-Channel) an ein tiberregionales Bussystem aufweisen, das insbesondere 
Daten 0ber lange Strecken innerhalb des Arrays UbertrSgt und/oder 

40 insbesondere direkten AnschluS an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussystem bereits 
djsm peripheren Protokoll entspricht oder tiber entsprechende Protokollwandler 
zur Umsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Industriestandard entsprechen, z. B. PCI, RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS, DDR- RAM etc. um sotnit einen einfachen und 

\inaufwendigen Anschluss der peripheren Gerate zu ermaglichen. Gegebenenfalls 
kOnnen auch in zwischengeschalteten XOAGs (vgl. DE 196 54 595.1-53 ) 
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Protokollkonvertierungen derart durchgefilhrt werden, so dass ein internes 
vereinf achtes und ggf . proprietSLres Busprotokoll auf ein oder mehrere 
koxnplexere exteme Standardprotokolle tibersetzt werden. 
Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indungsgem^fi besonders relevant, dass PAEs auch mehrere 
Anschltisse an dedizierte Bus syst erne aufwexsen kCiuien. 

10 

Desweiteren sind anwendungsabhSngig auch Architekturen sinnvoll, bei denen 
nux eine Teilmenge der PAEs Anschltlsse an ein dediziertes Bussystem aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von Anschlttssen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer AusfOhrungsvariante 
der erfindtingsgemaSen Kopplung von IPAE und RRAM ausgefUhrt: 

£s wird erfindungsgemaS bei einem in Funktion und/ Oder Verne tzung 

20 insbesondere zur Lauf zeit ohne St5rung nicht zu rekonf igurierender Elemente 
rekonf igurierbaren Zellelementefeld zur Datenverarbeitung mit Punktionszellen 
zur Ausftlhrung algebraischer und/oder logischer, konfigurierbarer Punktionen 
Mnd Speicherzellen, um Informationen zu einpfangen, abzuspeichem und/oder 
auszugeben vorgeschlagen, daS eine Steuerverbindung (CMD) von den 

25 Punktionszellen zu den Speicher zellen geftihrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und/oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Pxmktionszelle, typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die nachste tibertragene Information als 
Adresse Oder als Daten behandelt werden soil und ob ein Lese- und/oder 

30 Schreibzugriff erforderlich ist. Diese Datenttbertragmg aus der 

Speicherzelle, bei der es sich etwa um eine RAM-PAE handeln kann, auf die 
ALa-PAE erlauben dann, daS neue, von der ALU abzuarbei tende Befehle in diese 
geladen werden k6nnen. Es ist auf diese Weise mdglich, lediglich durch 
Vorsehen einer dedizierten vnd dediziert funktionszellenkontrollierten 

35 Steuerverbindung zwischen Funktionszelle und Speicherzelle bereits mit nur 
zwei Elementen, die ttber geeignete Busse verbtuiden sind, eine 
Sequenzerstruktur in einem Zellelementefeld aufzubauen, ohne daS ansonsten 
weitere Mafinahmen und/oder bauliche Veranderxingen erforderlich sind. In der 
Speicherzelle k6nnen Daten, Adressen, Programmschritte usw. in per se aus 

40 herkOramlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Seguenzerstrukturen als auch vektoriellen \and/oder pa- rallelisierbaren 
Struktxiren besonders gut anpaiSbar ist. 

45 

Es ist einsichtig, daS durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementefeld, nSmlich der Funktionszelle und der 

7 



wo 03/036507 



PCT/EP02/10572 



Informationsbereitstelliangszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonf igurierbaren Zellelementef eld aufgebaut werden kann. 
Dies ist insofern vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaskingf ahigen Betriebs system, eine Reihe xanterschiedlicher \ind 
5 voneinander per se verschiedener Aufgaben abgearbeitet werden mufi. Es kfinnen 
dann eine Vielzahl derartiger Aufgaben in einem einzigen Zelleleznentefeld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile ftlr 
Echtzeitanwend\ingen sind of f ensichtlich. Weiter ist es auch mOglich, die 
einzelnen Sequenzerstrukturen, die in einem Zell- elementefeld' tmter 
10 Vorsehung der erfindungsgemaSen Steuerverbindung aufgebaut werden, mit 

unterschiedlichen Taktraten zu betreiben, etwa um den Stroraverbrauch dadxirch 
zu senken, dafi Aufgaben mit geringerer Prioritat langsamer abgearbeitet 
werden. Es ist tiberdies mttglich, bei der Ausftlhrxing per se weitgehend 
paralleler Algorithmen sequenzerartige Programmteile in dem Feld parallel 
Oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in Funktion und/oder Vemetzung konfigurierbaren 

Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder Kombinationen 
derselben . 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sie insbesondere grobgranuleure Elemente darstellen, die aber mit einer 
feingranularen Statemachine versehen sein kdnnen* In einem besonders 
bevorzugten Ausftihrungsbei spiel handelt es sich bei den ALUs um sogenannte 
erweiterte ALUs (EALU) , wie diese in den frUheren Anmeldungen des 
vorliegenden Anmelders beschrieben wiucden. Eine Erweiterung kann insbesondere 
die Steuerleittingskontrolle, Befehlsdekodiereinheit etc. umfassen, soweit 
erforderlich. Es soli darauf hingewiesen werden, dass grundsdtzlich zumindest 
eine Teilmenge der Funktionszellen auch aus feingranularen FPGA-Elementen 
aufgebaut sein kann. 

Die Speicherzellen kSnnen Daten und/oder Informationen flttchtig und/oder 
nichtflttchtig speichem. Wenn in den Speicherzellen abgelegte Informationen, 
seien es Prograiranschritte, Adressen ftir einen Zugriff auf Daten oder 
registerartig bzw. heap-artig abgelegte Daten als flttchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonfiguration wShrend des Betriebes 
erfolgen. Altemativ ist es mOglich, nichtf Ittchtige Speicherzellen 
vorzusehen. Die nichtfltichtigen Speicherzellen kdnnen etwa als EE-Prom- 
Bereich \md dergleichen vorgesehen werden, in die ein rudimen tares Bios- 
Programm abgelegt wird, das bei Xnbetriebnahme der Anordnung auszufOhren ist. 
Auf diese Weise kann ohne weitere Bau telle eine Inbetriebnahme einer 
Datenverarbeitungseinrichtung erfolgen. Ein nichtfltlchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und/der RaumgrOnden 
beschlossen wird, daiS immer wieder dieselben Programmteile auszuftihren sind, 
wobei dann auch tinter solchen festen Programmteilen, etwa nach Art der WAVE- 
Rekonfiguration, im Betrieb gewechselt werden kann. Die MCglichkeiten, 

8 
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derartige nichtfliichtige Speicher vorzusehen und zu verwenden, sind 
Gegenstand anderer Schutzrechte des Anmelders. Es ist mfiglich, sowohl 
fltichtige als auch nichtfltlchtige Daten in den Speicherzellen abzuspeichem/ 
etwa urn ein Bios-Programni test abzulegen \ind die Speicherzelle dexmoch £Ur 
5 andere Zwecke nutzen zu k&nnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, daS sie sine hinreichende 
Vielzahl von zu verarbeitenden Daten und/ Oder abzuarbeitenden Prograiranteilen 
speichem kann. Es sei dabei darauf hingewiesen, dalS diese Programmteile 

10 sowohl als Prograxnxnschrltte ausgebildet sein k5nnen, die jeweils vorgeben, 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuemde Funktionszelle, im nachsten Schritt zu tun hat, 
als auch ganze Konfigurationen fttr Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne weiteres mttglich, da£ die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, auf Grund dessen eine Rekonf iguration 
von Zellelementefeldbereichen erfolgt. Dcunit arbeitet die diese Konf iguration 
ausl6sende Funktionszelle dann zugleich als Ladelogik (CT) . Es sei darauf 
hingewiesen, daE die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dalS dort eine secjuenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Feldem wiederum mOglich, andere Zellen im Verlauf der 

Prograiranarbeitung zu konf igurieren bzw. rekonf igurieren. Dainit ergibt sich 
ein iteratives Konfigurieren von Zellelementebereichen und ein Einschachteln 
von Prograiranen mit Seguenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, da& hier 

25 insbesondere durch Ein-Ausgabezellen ein Zugriff auf weitere 

Zelleleinentefelder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistimg xnassiv erh6hen kann. Es ist insbesondere 
mOglich, bei Auftreten von Konfigurationen in einem Codeteil einer in ein 
Zelleleiaentefeld hineinkonfigurierten Sequenzerstruktur gegebenenfalls 

30 entweder die Konf igurationsanforderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzuftihren und/oder es kOnnen derartige Anforderungen an eine 
Konf igurat ions -Mas tereinheit abgegeben werden, um sicherzustellen, dafi eine 
gleichm^Sige Belegvmg aller Zellelementefelder erfolgt* Es ergibt sich somit 

35 quasi ein Unterprograinmaufruf durch (Jbergabe von erforderlichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fUr sich als 
schutzwilrdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofem sie selbst far die Konfiguration anderer Zellelementf eldbereiche 
Zustandigkeit besitzen, mit hard- oder sof twareartig implemen tier ten FIIjMO- 

40 Strukturen und dergleichen zur Sicherstellung einer ordnungsgeinafien 

Rekonfiguration versehen sein kdnnen. Auf die MOglichkeit, die Speicherzellen 
wahrend der Abarbeitung von Befehlen derart zu beschreiben, dafi sich der 
cibzuarbeitende Code bzw, das abzuarbeitende Prograitrm a.ndert, sei hingewiesen. 
In einer besonders bevorzugten Variante ist diese Art der Selbstmodif ikation 

45 (SM) aber durch eine entsprechende Steuerung tlber die Funktionszelle 
unterdrUckt . 



9 
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Es ist mOglich, dafi die Speicherzelle abgespeicherte Information hier auf die 
J^steuerung der sie steuernden Funktionszelle direkt oder indirekt auf einen 
zur Funktionszelle ftlhrenden Bus gibt. Die indirekte Ausgabe kaxin 
insbesondere dann erfolgen, wenn beide Zellen benachbart liegen und die durcb 
5 Ansteuerung angeforderte Information an die ALU-PAE fiber ein Bussegment 
eintreffen muS, das nicht unxnittelbar mit dem Ausgang der Speicherzelle 
verbunden werden kann. In einem solchen Fall kann die Speicherzelle Daten auf 
dieses Bus system insbesondere Uber Rtickwartsregister (Backward-Register) 
ausgeben. Es ist dciher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/oder Funktionszelle ein solches Backward-Register aufweist, welches im 
Infonnationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann. Diese Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren FunktionalitSten versehen sein, obwohl dies etwa bei Anforderung von 
Daten aus der Speicherzelle fUr die weitere Verarbeitung, entsprechend einem 

15 herkfimmlichen IiOAD-Befehl eines typischen Hikroprozessors, zur VerSbiderung 
der Daten noch vor dem Hineinladen in die PAE ohne wei teres denkbar isti urn 
z. B. einen Befehl LOAD-i-t- zu realisieren. 

Mit anderen Worten werden innerhalb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Anmelders 

20 typischen Forward (FRE6) - und Backward (BRK6) -Register geftlhrt. Diese besitzen 
die MGglichkeit Daten zwischen horizontalen Bussystemen vertikal zu 
Ubertragen und k($nnen mehrere Busse multiplexen oder demultiplexen. Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREX3 (entgegen 
ihrer Namensgebung) nicht zwangsiaufig Registerstufen darstellen, sondem 

25 lediglich optional und ggf . konf igurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREG und/oder BREG der jeweiligen 
Funktionszellen (PAEs) geftUirt werden, urn die Busdaten transfers entsprechend 
des aktuell ausgeftUirten Befehl s zu steuem. 



30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Informationen von der 
sie steuernden Funktionszelle zu empfangen, wobei auch weiter ein 
Inforraationseinspeichern flber eine Ein-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuemde zelle mdglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 soil en, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE) von der 
Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenfalls auch direkt an die 
Funktionszelle (PAE) zu tibertragende Information zu lesen ist, an die I/O-PAE 
von der ALU-fae tkbearmittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, daS diese Adresse Ober eine AdreSUbersetzungstabelle 

(Adresstranslationtable) , einen Adresstranslationbuff er oder eine NKa-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 



45 Die Funktionszellen-Speicherzellenkombination ist deranach in einer 

bevorzugten Variante ziimindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine exteme Eihheit, eine andere Funktionszelle, Funktionszellen- 

10 
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Speicherzellen-Kom-bination und/oder Speicherzellen information gesandt 
und/oder von dieser enqpfangen werden kann. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum Emspfang von 
5 Steuerbefehlen aus der Funktionszelle ausgebildet. 

Die Funktionszellen-Speicherzellenkombination weist bevorzugt 
DatentransfermOglichkeiten an die Obrigen Funktionszellen und/oder 
Speicherzellen eines VP0-Bausteines auf , insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif fsmSglichkeiten ttber die 
Bussysteme auf die entsprechenden Zellen zur Verfilgung gestellt. Der Zugriff 
erfolgt bevorzugt tiber die Forward- und/oder Backward- Register der PAEs der 
Funktionszellen-Speicherzellenkombination, durch die Obertragung der "Port"- 
SteuerkozmDandos . 



In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachfolgenden 
Steuerkommandos zu tlbertragen: 

20 

OPCODE FETCH, 

INTERNE/EXTERNE DATENZUGRIPFE, 

POSXT10KXERON6 VON INTEKNEN/EXTERNEN ADRESSPOXNTERN, 
P0SXTI0NIERTJN6 VON XNTERNEN/EXTERNEN PROGRAIflMPOXNTERNr 
25 PROGPAMMPO INTER INCREMENT, 

POSITIONIERUNG VON XNTERNEN/EXTERNEN STACKPOINTERN, 
STACKZUGRXFFE (PUSH, POP) 

Beispielsweise kann diese Punk tionali tat durch folgende CMD Steuerkommandos 
30 ixnplementiert werden: 

load_const: Lade eine Konstante in ein Register 

write„Rap: Setze Adress Pointer fUr Speicherzugrif fe 



15 



35 



40 write&decr.Jlsp : 



set^pp: 
45 set&push^pp: 



write_Reg: 



read,.Jlap : 



read^Reg i 



read&incr.Jtep : 



(z. B. Heap) 

Lese Adress Pointer fOr Speicherzugriffe 
(z. B. Heap) 

Lese ein Register aus dem Speicher (wenn Register in der 
RAM-PAE ixnplementiert sind) 

Schreibe Daten in ein Register im Speicher (wenn Register 
in der RAM-PAE ixnplementiert sind) 

Schreibe ein Datenwort auf den Stack und dekrementiert 
den Stackpointer 

Xiese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 

Setze Prograinnqpointer 

Schreibe Prograironpointer auf Stack und setze 
Programmpointer neu 
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Die Steuerkommandos dienen der Steuerung der angeschlossenen Speicherzellen 
und Funkbionszellen (PAEs) . Weiterhin steuem die Steuerkommandos den 
Datentransfer auf den Bussystemen, beispielsweise durch Ansteuerung von 
Multiplexern, Switches, Transmission Gates, o, cl. in den Forweurd- und 
5 Backward-Regis tern (FREG/BREG) . Weitere Befehle sind z. B. : 

read_Port: Lese Daten von einem Port (beispielsweise implementiert 

durch ein FREG) zum Array 
write_Port: Schreibe Daten auf einen Port (beispielsweise 

iinpleiaentiert durch ein BREG) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den Empfclngem erfolgen. Die jeweils 
erforderlichen Steuer- und Dekodiemdttel k6nnen problemfrei und 
kostengtostig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
IS Signalen eine praktisch vollstdndige SeguenzerfcUiigkeit der Anordnung. Dai^ 
auf diese Weise eine Allgemeinzweckprozessordatenverarbeitungseinheit 
erhalten wird« sei erwShnt. 

Die Anordnung wird typisch so gew^lt sein, daiS die Funktionszelle als 
20 alleiniger Master auf die Steuerverbindung und/oder ein als steuerverbindxjng 
dienendes Bussegment bzw. Bussystem zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuerleitung als Conunand-Xieitung wirkt« wie sie in 
herk5inmlichen Prozessoren vorgesehen ist. 

25 Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 

benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, 6a& die Zellen unndttelbar nebeneinander angeordnet sind. Altemativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt daftir, daE keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der angeforderten Information in der Funktionszelle auftreten, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
,direkt* verstanden. Milssen Latenzzeiten berilcksichtigt werden, so kann auch 
ein Pipelining in den Sequenzerstrukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen. Es sei darauf 

hingewiesen, dafi es ohne weiteres mOglich ist, entsprechend hochfrequent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
k6nnen. Auch in einem solchen Fall, etwa wenn per se bekannte 

40 Architekturelemente fOr die Funkt ions zellen verwendet werden, wird 

gleichzeitig eine Rekonfigurierbarkeit des Fiinktionszellenelementes vind der 
zugehSrigen Vemetzungen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funkt ions zellen, die Informationsbereitstellungszellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelm^ige Struktxir vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer ersten Reihe 
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Information, das heifit Operanden, Konf igurationen. Triggers ignale usw. 
zugefUhrt, wahrend in einer dariinterliegende Reihe Daten, Tr igger signal e und 
andere Informationen abgegeben werden. In einem solchen Fall wird es 
bevorzugt sein, wenn die Zellen in ein und derselben Reihe liegen xmd es kann 
5 dann der Informations transfer aus der Inf ormationsbereitstellvmgszelle in den 
erforderlichen Eingang der Funktionszelle Hber ein Backward-Register 
erfolgen. Die Mfiglichkeit, die Register ftlr Pipelining zu benutzen, sei 
erwclhnt. 



10 Es wird weiter Schutz beansprucht ftlr ein Verfabren z\un Betrieb eines 

Zellelementef eldes , insbesondere multidimensionalen Zellelementef eldes mit 
Funktionszellen zur Ausftthruaig algebraischer und/oder logischer Funktionen 
und Informationsbereitstellungszellen, insbesondere Speicher zellen \md/oder 
Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen und/oder 

15 Speichern derselben, wobei zumindest eine der Funktionszellen Steuerbefehle 
an zumindest eine Informationsbereitstellungszelle ausgibt/ dort im 
Ansprechen auf die Steuerbefehle Information ftlr die Funktionszelle 
bereitgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgestellte Information 

20 durchzufUhren, urn so seguenzerartig Daten zu verarbeiten. 



Es wird also in einem rekonfigurierbaren Feld durch die Ausgcibe der 
Steuerbefehle an die Speicherzelle einer Sequenzerstrukt\ir eine 
sequenzerartige Datenverarbeitung ermOglicht. Die Befehle, die als 
25 Steuerbefehle von der Funktionszelle ausgegeben werden k6nnen, ermfiglichen 
dabei einen sequenzerartigen Betrieb, wie er aus herkfimmlichen Prozessoren 
bekannt ist. Es sei darauf hingewiesen, dafi es ohne wei teres mCglich ist, nur 
Teile der genannten Befehle zu implementieren und dennoch eine vollstSndig 
sequenzerartige Datenverarbeitung zu gewShrleisten. 

30 

Die vorstehende AusfOhrungsvariante wird im folgenden noch einmal und 
beispielsweise anhand der Zeichnungen besclirieben. In di eser ist gezeigt 
durch: 



35 Fig. 1 ein erf indungsgemSEes Zellelementef eld. 

Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Da t enver arbe i tungs z ei ten , 
Fig. 3a eine alternative Ausftttxrungsform des Details 

40 von Fig. 2, 

Fig. 3b eine besonders bevorzugte Variante des 

Details. 

Fig. 4 Grundaufbau einer Punktions-/Speicherzelle 

(PAE) 

45 Fig. 5 eine Ausgestaltungsveiriante von Fig. 3b 
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Nach Fig. l(a/b) lamfafit ein allgemein mit 0101 bezeichnetes Zellelementefeld 
zur Datenverarbeitung 0101 Funktionszellen 0102 zur Ausftihrung von 
arithmetischen und/oder loglschen Fiinktionen sowle Spelcherzellen 0103, urn 
Informationen zu empfangen, abzuspeichem vmd/oder auszugeben, wobei eine 
5 Steuerverbindung 0104 von Funktionszellen 0102 zu den Spelcherzellen 0103 
geftthrt ist. 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordiing der Funktionszellen und Speicherzellen 
10 dar. 

Das Zellelementefeld 0101 ist in der Vernetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zwar ohne den laufenden Betrieb nicht neu zu 
konflgurierender Zellelementeteile zu stOren» Dabei kOimen die Verbindungen 
konfiguriert werden, indem Bussysteme 0105 wie erforderlich geschaltet 

IS werden. Weiter sind die Funktionszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bel den Funktionszellen handelt es sich urn arithroetische 
Logikeinheiten, die um bestiinmte, Rekonfiguration ermfiglichende Schaltkreise 
erweitert sind, wie Statema chines, Schnittstellenbeschaltung zur 
Kommunikation mit der bevorzugt au£erhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voranmeldiuigen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

25 unmittelbar neben einer Funktionszelle 0102 liegt und hier je Reihe drei 

Speicherzellen-Punktionszellen-Paare vorliegen, in denen die Fxmktions- und 
Speicherzellen jeweils tiber Steuerverbindungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Eingclnge auf, die 
mit dem Bussystem oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu en^fangen. Weiter weisen die Zellen 0102, 
0103 AusgSnge auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
ausgeben. Wie noch erlSutert werden wird, ist (Iberdies jede Speicherzelle 
0103 mit einem RUckw&rtsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kSnnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. 2) handelt es sich bei dem Zellelementefeld zur Datenverarbeitung von 

40 Fig. 1 um ein herkdmmliches Zellelementefeld, wie es bei rekonfigurierbaren 
Datenverarbeitunsanordnungen, beispielsweise einer VPU entsprechend der XPP- 
Technologie des Anmelders gebrSuchlich und bekannt ist. Insbesondere kann das 
Zellelementefeld von Fig. 1 wie belcannt betrieben werden, weist also 
entsprechende Beschaltungen zur Wave-Rekonfiguration, zum Debugging # 

45 Obertragen von Triggersignalen etc. auf. 
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Die Besonderheiten des Zellelementef eldes der vorliegenden Erfindung ergeben 
sich aus der SteuerverbindTong 0104 uad der zugeharigen Beschaltimg, die 
nachfolgend naher beschrieben werden wird mit Bezug auf die Fig. 2a-c. Hs sei 
dabei erwahnt, dafi, wShrend in Fig. 1 eine Steuerverbindxing 0104 stets von 
5 einem weiter linlcs liegende Funktionszellenelement zu einer weiter rechts 
liegenden Speicherzelle geftthrt ist, und zwar nur und genau zu einer solchen 
Speicherzelle, es einleuchtenderweise m«Jglich ist, auch fOr die 
Steuerleitungen eine konf igurierbare Veraetzung vorzusehen, um entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder um ggf . mehr als 

10 eine Speicherzelle ansprechen zu kCSnnen^ wenn etwa in groSem Umfange 

Speicherbedarf fOr Informationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichem und/oder auszugeben ist. Aus Grtinden der 
tfcersichtlichkeit wird aber in Fig. 1 und 2 lediglich auf fest vorgesehene 
einzelne Steuerverbindungen Bezug genommen, was das Verst&idnis der Erfindung 

15 wesentlich erleichtert. Die Steuerverbindung ist im tibrigen 

erforderlichenfalls durch herkammliche Leitungen, entsprechende Protokolle 
vorausgesetzt, substituierbcur. 

In Fig. 2 ist die Funktionszelle 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, veriauft der 

Bus 0105a, der das bereits erwahnte Backward-Register 0103a mit den EingSngen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das xinterhalb der Reihe 
verlaufende Bussystem ist mit 0105b bezeichnet xrnd es sind von dem Bussystem 
0105a, 0105b nur die relevanten Segmente gezeichnet. Es ist erkexmbar, daS 
25 das Bussystem 0105b altemativ Daten erhSlt aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des RAM 0103 und da& es Daten in den Eingang 0103al 
des Backward-Registers fOhrt. 

Die ALU 0102 weist zugleich weitere Bin- und AusgSnge 0102al, 0102a2 auf, die 
30 auf andere Bussegmente gescheJ.tet sein kdnnen und fiber welche die ALU Daten 
wie Operanden eic^fSngt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 befindet sich dauerhaft unter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindimg dar, iXber 

35 welche eine Vielzahl von Bits tibertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, daS zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/Backward- 
Register (FREG/BREG) tibertragen werden kSnnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Prograxnm-Bereich . Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, fiber den bestimmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Progransnbereiches jeweils lesend Oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAE Daten tlber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt warden kdnnen, 
wobingegen der zeitgleich bestehenden, wenngleich nicht benutzten Verbindung 
zwischen dem Ausgang 0103c des RAH z\m Bus 0105b und der Verbindung zwischen 
dem Ausgang des Backward-Registers BW zum Eingang 0102b der ALU-PAE zum 
5 Zeitp\inkt von Fig. 2b keine Bedeutung zukommt, weshalb diese gestrichelt 
cuigedeutet sind. In Fig, 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 Ober ihren Ausgang 0103c aus dem tiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information tiber das Backward-Register an den Eingang 2b der ALU-PAE 0102 
10 speist, wSUirend der Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus diesem Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAM-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
liber die Steuerleitung 0104 bzw. das Steuerleitungsbussegment 0104 empfangene 
Information decodiert wird. 

Die Ausftihrungsvcuriante der Erfindung wird verwendet wie folgt: 

20 

ZunSchst eit^f^ngt die ALU 0102 Konf igurationsinf ormation von einer zentralen 
Ladelogik, wie im Stand der Technik bereits bekannt. Die 

Inf ormationstUsertragung kann in per se bekannter Weise unter Verwendwg des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die MSglichkeit, bei der 
25 Ladelogik einen FILMO-Speicher usw. vorzusehen, um eine ordnungsgernflfie 
Konfiguration der Anordnung zu ermOglichen, wird hingewiesen. 

Mit den Daten fOr die Konfiguration der ALU 0102 wird zugleich eine Reihe von 
Daten aus der Ladelogik Ubertragen, die ein seguenzerartig abzuarbeitendes 

30 Programm darstellt. Dieses Programm kann entweder bereits das zur Berechnung 
bzw. AusfUhrung der Applikation auszuftihrende Programm sein, oder einen is 
Urlader (Boot) darstellen, der erst das auszuftihrende Applikationsprogranan 
von einer extemen Eiriheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann ent fallen, wenn ein Teil des der ALU zugeordnet^ Speichers 

35 nichtfldchtig (z. B. ROM, EPROM, EEPROM, Flash-ROM) ausgestaltet ist und ein 
Urlader oder das Applikationsprogramm dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
land unab&iderlich gestaltet werden kann, da eine feste In^lementierung dann 
zu einer erheblichen Kostenreduktion ftihren kann» Die ALU gibt deshalb 

40 wahrend ihrer Konfiguration auf der Leit\mg 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empfangene Daten Uber den Ausgang 0102c tiber den Bus OlOSbl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 

45 PAE 0103. Von der Einheit 0103d werden entsprechend des Steuerbefehls auf 
Steuerleitung 0104 dann Daten auf den coigewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis s&atliche, von der Ladelogik bei der 

16 



wo 03/036507 



PCT/EP02/10572 



Konf iguration empfangenen Prograinmteile in der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konf iguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle au£ der Steuerleitung 0104 die n^chsten, 
von ihr sequenzerartig abzuarbeitenden Prograinitischritte anfordem \md tiber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihrem Eingang empfangen. wahrend der Programmabarbeitung 
kdnnen dabei Situationen auftreten, bei denen Sprilnge innerhalb des 
Programmspeicherbereiches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden mtissen usw» Die 

10 diesbeztigliche Kommunikation zwischen ALU-PAE und RAM-PAE erfolgt liber die 
Steuerleitung 0104, so dafi die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchfOhren kann. Oberdies kdnnen auch, wie bei einem herkdinmlichen 
Kikroprozessor/ IDaten aus einem Stack oder einem anderen RAM-Speicherbereicb 
empfangen werden iind es kOnnen llberdies Daten von auSerhalb als Operanden in 

IS der ALU-PAE enqpfangen werden. 

Es findet dabei die Abarbeitung der Programmseguenz statt, die in den HAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Befehlsdekodierung vorgenommen . Dies 
20 geschieht mit den per se gleicben Schaltkreisen, die schon ftir die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird tiber die ALU zu jedem Zeitpunkt die Steuerleitimg 0104 kontrolliert, 
so daS die RAM-Zelle stets genau die Art des Speicherzugrif fes befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, daiS 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Sequenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen ftlr zu holende und/ oder zu schreibende Daten oder Codes 
liegen oder ob und gegebenenfalls wohin Daten zu schreiben sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder verclndert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Varianten. 

35 Nach Fig. 3a ist zur Verbindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondem es sind auch ein 
VorwSrts -Register an der RAM-PAE und VorwSLrts- und Rtlckwarts -Register an der 
ALU-PAE vorhanden. Diese k5nnen, wie d\arch die Mehrfach-Pfeile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen HostS/ extemen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Sequenzerstrukturen, PAEs, RAM-PAEs etc. Daten zu exnpfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbefehl fOr neue Programmteile aus 
der Sequenzerstrukt\ar, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es mtiglich, Programmbldcke in der Sequenzerstruktur 

45 abzuarbeiten, die weit grCfier sind als jene, die in der RAM-PAE speicherbeur 
sind. Dies ist insbesondere bei komplexen Datenverarbeitwgsaufgaben, 
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Sprtingen tiber weite Bereiche, insbesondere in Unterprogramme usw, von 
massiveiQ Vorteil. 

Eine noch waiter bevorzugte Variante ist in Fig. 3b gezeigt. Hier 
5 koinnruniziert die ALU-PAE nicht nur mit einer RAM-PAE, sondem zugleich mit 
einer Input /Output-PAE, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung fUr die Kommunikation mit extemen Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VPUs, fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU-FAE die Einheit, die als Master fOr 
10 die als .CHD"* bezeichnete Steuerverbindtmg arbeitet iind wiederum werden die 
Busse in Multiplex-Weise verwendet. Auch hier kann eine (Jbertragiing von Daten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Register erfolgen, 

15 Die in Fig, 3b gezeigte toordnung ermOgliclit es, externe Zugriffe auf nicht 
in der Speicherzelle RAM-PAE abspeicherbare Inf ormationen besonders leicht zu 
gestalten und erm&glicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkGmmliche CPU-Technologien und deren Betriebsverfahren in noch 
starkerem MaSe insoweit, als nun in der Eingabe-Ausgabezelle 

20 Adressttbersetzxmgsmittel, Speicherverwaltungseinheiten (MMO-F\anktionen) und 
dergleichen implement iert sein kOnnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, daS mehrere Sequenzerstruktur en gleichzeitig in 
25 ein und dasselbe Feld hineinkonf igiiriert werden kSnnen, dafi Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise fUr Sequenzerstrukturen 
und/oder eine fttr die XPP-Technologie herkfimmliche Weise konf iguriert werden 
k6nnen und dafi es ohne wei teres mOglich ist, dafi eine ALU an eine andere ALU 
Daten ausgibt, die diese in einer Sequenzer- Weise konf igurieren und/oder zum 
30 Teil eines Zellelmentefeldes xnachen, mit dem eine bestimmte Konfiguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer oder mehreren ALUs und/oder 
einem Speicher und/oder FPGA- Element en erhait Daten von dem Bussystem 0105a 
und tlbertragt die Brgebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREG, 0403) angeordnet und tibertragen Daten von 0105a nach 0105b (FREG) bzw. 
40 von 0105b nach 0105a (BREG) .BREG und FREG kOnnen ebenfalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen enthalten. Bevorzugt 
sind diese jedoch in ihrem Funktionsximfang gegenUber dem Kern (0401) 
eingeschrSLnkt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 Obertragung von Daten (DATA) und ein Bussystem zur Obertragung von Trigger, 
also statussignalen (TRIGGER) unterteilt. 
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Die Konf iguration der PAE erfolgt durch eine tibergeordnete 
Konfigurationseinheit (z. B. eine CT) , die tiber einen Konf igurationsbus 
(0404) Konfigurationsworte an die PAE tibertrSgt. Diese warden in 
Konf igurationsregistem gespeichert (0405) . Optional kann ein 
5 Konfigurationsstack (0406) nach PACT17 \ind wie nachfolgend beschrieben 

zwischen den Konfigurationsbus (0404) und die Konfigurationsregister (0405) 
zwischengeschaltet sein. 

Der Konfigurationsstack kann Daten \ind/oder bevorzugt Trigger von den 
Bussystextien 0105 (a/b) enrpfangen und an diese senden. 

10 

Die PAE kann optional einen Anechlufi an ein dediziertes Bussystem (10- 
Channel, 0407) aufweisen. Zur Steueirung des Bussystems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet. tJber den lO-Channel 
kan die PAE direkt mit einem global en, ggf . auch externen Speicher und/oder 
15 Peripherie und/oder anderen PAEs Daten tlbertragen. 

In einer bevorzugten Ausgestaltung besteht die MOglichkeit Konstanten fOr die 
Datenverairbeitung tiber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregistem 
20 auslesen . 

Pigur 4 kann auch eine entsprechende RAM- PAE darstellen* Cber 0404 kann dann 
von einer CT die Vemetzimg und Punktion des RAMs eingestellt werden. 
Die Funktion umfafit beispielswiese folgende Funktionen oder Koznbinationen 
25 daraus : 

1. Random Access 

2. FIFO 

3 . Stack 
30 4. Cache 

5. Page Memory ftlr MM0s 

Desweiteren kann in einer bevorzugten Ausftihrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B. Konstanten, 
35 Lookup-Tabellen, etc.). Ebenfalls kann die CT in einer erweiterten Ausfahrung 
Daten (z. B. zum Debuggen oder ftlr Taskwechsel) aus dem Speicher Ober 0404 
zurUcklesen . 

In einer bevorzugten Ausftihriing kann eine RAM-PAE mehrere Anschltisse an das 
Bussystem 0105 aufweisen (dual-port oder multi-port) , wodurch mehrere 
40 Datentransfers gleichzeitig durchgefOhrt werden k6nnen. 

In einer weiteren Ausftihnmg kann die RAM-PAE einen dedizierten AnschluS an 
einen externen Bus aufweisen. 

RAM- PAEs kSnnen derart zusaramengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grOfierer Speicher entsteht. 

45 
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Figur 5 zeigt eine Ausgestaltungsvariante des Sequenzers nach Pigur 3b. Die 
ALU-PAE weist einen minimalen Registersatz Ra, Rb, Rx auf , der in diesem 
Beispiel lediglich zur Pufferung der Qperanden und Ergebaisse dient. Der 
eigentliche Registersatz liegt in der RAM-PAE (RO..Rn). Ebenfalls innerhalb 
5 der RAM-PAE liegen die Register 



Rpp: Prograiran Pointer 

Rap: Tldress Pointer £(ir Datenzugrif £e (z.B. Heap) 

Rsp: Stack Pointer ftir Stackzugrif f e 

Rfp: Frame Pointer zur Sicherung des Stack Pointers 

10 bei Unterprogrammaufrufen 



Der CMD-Bus wird von der ALU-PAE gesteuert \ind Ubertragt die 
Ablauf information des Sequenzers an sSmtliche beteiligten PAEs, sowie FREG 
und BREG zur Steuerung der Daten(tt>ertragung auf den Bussystemen (0105a/ 
15 0105b) . 

Die RAM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten 10- 
Cannel (0501) auf, Uber welchen sie ggf . auch selbststSndig (z. B. -Qber 
Kontroller) Daten von Oder zu peripheren Einheiten (z.B, 10, Speicher) 
tlbertragen kann. Es soli nochmals darauf hingewiesen werden, dass auch die 
20 ALU-PAEs einen solchen dedizierten AnschluS aufweisen kOnnen oder in einer 
weiteren Ausgestaltxingsvariante die ALU-PAE anstatt der RAM-PAE einen 
derartigen AnschluS besitzen k&nnte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und/oder Speicherzellen) 

25 implementiert. tJber Eingabe-Ports (0502) kSnnen Daten von dem PA gelesen 
werden und tiber Ausgabe-Ports (0503) k&arnen die Daten ausgetauscbt werden. 
Die Port werden beispiel sweise tiber die CMD-Steuerkoimnandos readu-Port imd 
write_port auigesteuert und schalten die Bussysteme entsprechend. Mit den 
Steuerkomraandos wird ein Selektor Obertragen, der anzeigt welcher Port duorch 

30 das Steuerkoxnmando angesprochen ist. 

Die vorliegend of fenbarte Lage der Register innerhalb der RAM-PAE ist 
ungewOhnlich, bietet aber zwei erhebliche Vorteile: 

a) Speicherzellen kOnnen fUr die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugrif fe auf den 
35 Speicher besonders schnell werden. Desweiteren ist ftir s&atliche Speicher- 

Zugriffe nur ein Bus auf dem Bus system 0105 notwendig, wobei der 
normalerweise zus&tzlich erforderliche Adressbus entfSlllt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnimg wird daher als vom Amaelder bevorzugt typisch implementiert. 

40 

FUr sSmtliche Datentransfers ist die Lage der Register zu beachten. tJtn 
lediglich mfiglichst einfache Befehle im Sequenzer zu irnplementieren, sind 
daher besondere Befehle zur Registermanipulation vorgesehen: 
moveta Rrr: L^dt das Register Rrr (rr e {l..n, sp, pp, 
45 fp, ap}) nach Ra 

movetb Rrr: Lddt das Register Rrr nach Rb 
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movefx Rrr; Schreibt das Register Rx nach Rrr 



5 



urn den Datenfluficharacter der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode intplementiert : 

feed: tibertrelgt iDaten von Ra/Rb nach Rx, ohne diese 



zu xnanipulieren. 



Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2: 



Schiebe Register R4 nach Register R7: 
moveta R4; feed; movefx R7; 

15 ttoertrage R5 auf Stack: 

moveta R5; feed; push; 
Anmerlcung: push tlbertr^gt Daten des Registers Rx an die 3peicherstelle auf 
die Rsp zeigt und delcrementiert (bzw. inkermentiert) Rsp. 

20 Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7: 



Lade Daten aus Speicherstelle Rap nach Rl: 
load; feed; movefx Rl; 
25 Anmerkung: load Obertragt Daten von der Speicherstelle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fOr n = 7). Register werden 
30 beispielsweise angesprochen, indem beim Auftreten des entsprechenden CMD 

Steuerkoromandos- (z. B. read_reg, write_reg) die Regis temummer mitUbertragen 
wird, diese als Adresse an den Speicher tibertragen wird und die hOherwertigen 
Adressbits mit 0 gefUllt werden. 

Die Startadresse ft&r den Code ware dann beispielsweise 0x8 (also OxCn-i-l)), 
35 worauf dann der Prograrampointer Rpp nach einem Reset zeigen wUrde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondern in 
gesondert implementierten Regis tern imtergebracht, lom eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu esrrodglichen. 

40 In Figur 5b ist eine Architekturvariante mit Registersatz iimerhalb der ALU- 
PM dargestellt. Die umsttodlichen Registertransferoperationen entf alien 
damit, wodurch diese Variant e auch erheblich schneller in der 
Datenverarbeitung ist. Allerdings ist sind die Hardwarekosten hOher, da der 
Registersatz zusatzlich inplementiert werden muss und fOr sdmtliche 

45 Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE tibertragen 
werden mUssen. 



10 



moveta Rl; movetb R2; add; movefx R2; 



moveta R4; movetb R7; add; movefx Ra; 



21 



wo 03/036507 



PCT/EP02/10572 



RAMoverPAE 

Die nachfolgend beschriebene besondere Ausgestaltiing einer ALU-PAE (im 
Folgenden mit ROP-PAE bezeichnet) eignet sich besonders fttr VPUs, deren 
Applikation irreguiare sequent! elle Codes aufweisen, die auf kleine 
5 Datenmengen in einer weitgehend \mgeordneten Reihenfolge zugreifen. 

Ziir Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(Integrated RAM = IRAM) , auf den die ALU direkten Schreib/Lese-Zugrif f 
besitzt. Die ALU ist entsprechend urn eine Adressverwaltungsschaltung 
10 erweitert. Insbesondere kOnnen daher PAEs nach dem vorstehend beschriebenen 
Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf . entfailt und 
durch. den integrierten IRAM ersetzt ist Oder der RRAM zusSltzlich zum intemen 
IRAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten Ausftihrung ist ein Sequenzer bzw. 

Microcontroller mit einezn bevorzugt limi tier ten aber bevorzugt vollst^digen 
Befehlssatz (vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes ermOglicht. In einer weiteren 
Ausftihrungsvariante kann der Sequenzer in seiner Fxmktion und seinem 

20 Ablauf verbal ten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

nach dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Sequenzer /Microcontroller kann auf ZustSnde (z.B. 
Statussignale, Ereignisse) in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind (z.B. Uber ein 

25 BuBsystem) reagieren. 

Der Sequenzer /Microcontroller liest seine Programmbefehle aus dem IRAM. 
Die Zugrif fe auf das Bussystem des Arrays (PA) entsprechen den Ublichen PAEs, 
ebenso die Generierung, der Empfang xind die Weiterleitung von Status signal en 
(Trigger nach PACT08} . Mehrere Busanbindungen ftlr Daten- und Triggereingtage 

30 und fUr Da ten- und Triggerausg&ige kdnnen vorgesehen sein. 

Die ROP-PAE kcinn Operanden vom Bus lesen ggf. mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

In die ROP-PAE ist in einer bevorzugten Ausgestaltung ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung dhnlich 

35 des Registersatzes von Transputern als Stack organisiert. Dadurch kann der 
Registersatz besonders klein und hardware technisch ef f izient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputer technologie bekannt, dass Compiler eff izient mit einem 
derartigen hardware technisch kostengOnstigen Registersatz arbeiten k6iuien. 

40 Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten Ausftihrung besitzt die ROP-PAE direkten AnschluS 
(EXTBUS) an ein extemes RAM und/oder exteme 10. Bs kttnnen 

applikationsabh&igig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaltung kann der EXTBUS tiber eine, ggf. dedizierte, 
Verbindung des PAE-Bussys terns an eine Interface-Baugruppe (lOAG) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteueriing von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei d\irch die Inter face-Baugruppe . 

In einer bevorzugten Ausftihrung kann die ROP-PAE imd dabei bevorzugt das IRAM 
5 direkt selbstandig Adressen ftir das exteme RAM und/oder die exteme 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und exteme oder 
interne Daten transfers selbstSndig steuern. Diese Punktion kann durch 
eigenstandige im RRAM implement ierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller besonders fUr diese Aufgabe, indem 
10 sie blockweise Daten zwischen den Speichem kopieren. Der Adreasraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
In einer hardwaremaSig aufwendigeren LOsung kann die Funktion durch eine 
implementierte MemoryManageraentUnit (MMCJ) realisiert sein. Die Funktionsweise 
15 ist d\irch den Stand der Technik definiert und bekannt. Zusammengefafit 
arbeitet eine MMU wie folgt: 

Der von der MMCJ verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 
aufgeteilt. Jede Page enth&lt Daten eines virtuellen Speicherraumes innerhalb 
eines extemen Speichers. Beispielsweise kdnnen die hexadezimalen KRAM- 

20 Adressen OxOaOO. .OxOaf f Daten des externen Speichers an den Adressen 

03dDdl3200. .03cbdl32ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adresstibersetzungseinheit verwendet, die gewCShnlicherweise durch Lookup- 
Tabellen realisiert ist. Au£gabe einer MM0 ist es insbesondere einen grofien 
Speicherraum au£ einen sehr viel Rleineren <ln diesem Fall der RRAM) zu 

25 tibersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem groSen 
Speicherraum in den Kleinen kopiert werden. Sobald eine Seite nicht mehr 
benOtigt wird kann diese gelOscht und/oder Oberschrieben werden. Wenn die 
Daten auf der Seite verSndert wurden, wird die Seite bevorzugt vor dem 
Ltfschen/ttoerschreiben in den groJSen Speicherraum zurackgeschrieben. 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein hOherwertiger Teil der 
physikalischen Adresse (also die Adresse der Seite) in dem Lookup- Speicher 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verftigbar ist- 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von dem 
groEen (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gem^S dem vorstehenden Ablauf 
tiberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligimg 
40 durch den Sequenzer erfolgen, indem von der MMU ein DMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden Seitenadressen im RRAM und 
extemen RAM, sowie die Seitengr6fie durch die MMa zur VerfClgung gestellt (z. 
B. in Register eingetragen) . 

45 Die ROP-PAE besitzt einen AnschluiS an eine Konfigurationseinheit die die ROP- 
PAE entsprechend des tiblichen Verfahrens konfiguriert und rekonf iguriert. In 
einer bevorzugten Ausftihrung kann die CT auf den IRAM lesend und/oder 
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schreibend zugreifen, um Daten und/oder Code ftir den Secjuenzer im IRAM zu 
verwalten. 

In einer besonders bevorzugten Ausgestaltung kann die ROP-PAE selbsttodig 
5 Code £iir den Sequenzer tiber das PA Buseystem \ind/oder den EXTBUS aus dem 
extemen RAM laden. 

In einer bevorzugten Ausftihrung ist der IRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente k6iinen 
10 beispielsweise ftir einige der folgenden Funktionen aufgeteilt sein: 

Sequenzerspeicher, Stack (z.B. fttr Registers atz) , Datenspeicher, Heap, 10- 
Puffer, Puffer zu extemem RAM bzw. Cache, Lookuptabellen, Konf igurationen 
ftir PABs und/oder Busse, der Regis tersatz der ROP-PAE. 

Je nach Punktion keSnnen dazu folgende Ansteuermechanismen vorgesehen sein; 
15 Sequenzer- /Code-Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp), 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der a?echnik 
(z.B. Intel Pentium) bekannt ist. 
20 Konf igurationen fttr PAEs und/oder Busse: Hierrauf kann ein Zeiger innerhalb 
der CT und/oder - inclement ierungsabhSngig ein Zeiger innerhalb der 
Konf igurationssteuerung der PAE zeigen. 

Registersatz der XPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE mit bevorzugt 
^ 25 hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Compiler oder Programmierer aufgebaut- Die 
Adressierung dieser Bereich erfolgt durch das auszuftihrende Prograram und/oder 
Betriebssystems und wird innerhalb der Programmes imd/oder Be triebs systems, 
30 ggf . unter Zxihilfenahme der Register sat zes und der ALU des Sequenzers, 
berechnet . 

In einer mOglichen Variante ist der IRAM komplett oder teilveise, wie bei den 
IPAEs beschrieben, durch RAM- PAEs aufierhalb der ROP-PAE realisiert. Fttr ggf, 
unterschiedliche Segmente kOnnen unterschiedliche RAM- PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung kOnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMCT besitzen und 
somit selbstandig Daten in oder aus den ihrem Speicher von oder nach anderen 
Speichern oder PeripheriegerSten kopieren. Insbesondere k&nnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei fttr jedes Segment einzeln die 
Funktion konf igurierbar und/oder durch den Sequenzer programmierbar ist. 

In einer Ausftthriing kann der IRAM als Multi-Port Speicher ausgeftthrt sein. 
45 Dieser kann den ggf. auch gleichzeitxgen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicherzugrif f seinheiten auf den Speicherinhalt erm6glichen. 
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Speicherzugrif f seinheiten k6nnen bei spiel sweise exteme iind/oder interne 
Peripherie, Prozessoren, andere PAEs sein. 



In einer besonderen Ausflihning Tcann die ROP-PAE als lokale und ggf . auch 
5 globale Konfigurationseinheit ahnlich einer CT ftlr ROP-PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit er£(illen. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konfigurationseinheit. Wird die ROP-PAE als globale 
Konfigurationseinheit verwendet, oder hat sie sehr viele lokale PAEs zu 

10 konfigurieren/ wird bevorzugt das Verfahren nach der DE 196 54 593,5-53 

verwendet, das eine FILMO-PxinktionalitSt aufweist und daher sehr viele auch 
imabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Sequenzer /Microcontroller Konfigurationen im IRAM und konfiguriert 
diese an PAEs und/oder sich selbst tind/oder bestimmt den Ablauf des 

15 Sequenzers /Microcontrollers, Bevorzugt findet hierbei eine Synchronisation 
mit einer Obergeordneten Konfigurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konfigurationen tiber eines der 
EXTRAM-Interfaces selbst laden und/oder Konfigurationen von einer 

20 Obergeordneten Konfigurationseinheit tiber das CT Interface anfordem. Die 
Funktionsweise kann ahnlich der Rekonfigurationseinheit in der DE 196 54 
846.2-53 sein. 



Zusamniengefafit ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
25 Mi crocontrollersyst ernes, dessen Busanbindung und/oder dessen Datentransfers 
und/oder dessen Prograinmablauf einem VPU- System entspricht. Mit anderen 
Worten handelt es sich urn eine Moltiprozessoranordnung, deren Bussystem auf 
dem Prinzip der VPU-Architektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer Obergeordneten Steuereinheit (CT) verwaltet. Die 
30 DatenObertragung ist selbstsynchronisierend liber die RDY/AGK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Proz ess or status angesehen, der Uber das Triggerbus system reprSsentiert wird 
und den Status einer Menge von Prozessoren reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden mui^. Hierzu wird 
35 verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht ftlr ROP-PTUEs, die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (XO-Channel) an ein tiberregionales Bussystem aufweisen, das 

40 insbesondere Da ten ttber lange Strecken innerhalb des Arrays tiber tragt 

und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
AnschluS an die Peripherie kann dabei direkt erfolgen, indem z, B. das 
Bussystem bereits dem peripheren Protokoll entspricht oder Uber entsprechende 
Protokollwandler zur Umsetzung des Protokolls erfolgen. Das dedizierte 

45 Bussystem Icann dabei bereits einem Indus tries taindard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR- RAM, etc. um somit einen 
einfachen und unaufwendigen Anschluss der peripheren Gerate zu ermGglichen. 

25 
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Gegebenenfalls kannen auch in zwischengeschalteten lOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart durchgeftihrt werden, dass ein 
internes vereinfachkes vnd ggf . proprietHres Busprotokoll auf ein oder 
mehrere koinplexere exteme Standardpro toko lie tibersetzt werden. 
5 Es soil besonders darauf hingewxesen werden, dass unter Peripherie auch 

Speicher verstanden werden, wie bei den bereits au£gez£Uilten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indiingsgemafi besonders relevant, dass PAEs auch mehrere 
Anschlttsse an dedizierte Bussysteme aufweisen kOnnen. 
10 Desweiteren sind anwendungsabhtogig auch Architekturen sinnvoll, bei denen 

nur eine Teilmenge der PAEs Anschltisse an ein dediziertes Bussystem aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von AnschlUssen 
an ggf . auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halbleiterherstellungsverfahren und -strukturen besonders leistungsfcQiig 
in^lementiert wesrden, indem der Speicher auf dem physikalischen Chip rclumlich 
tiber Oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. HierfUr wird Schutz beansprucht. 

20 Dazu wird tlber der nach dem Stand der Technik bekannten ersten 
Halbleiter struktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine oder mehrere weitere Bbenen von 

Halbleiter strukturen (Transistorstrukturen) aufgebracht, die £tir zus&tzliche 
Funktionen genutzt werden k6nnen. Beispielsweise kfinnen in einer ersten Ebene 
25 die Logik und Gatter der PAE-Funktion \ind in einer weiteren zusatzlichen 
Ebene die Speicherfunktionen implementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten dvirch 

eine Isolierschicht voneineinder getrennt. Die Isolierschicht kann 
Durchkonbaktierungen (Vias) aufweisen, um Signale zwischen den einzelnen 
30 Halbleiterschichten zu (Ibertragen. 

Die Verdr ah t\mgs struktur kann je nach Anwendung unter schiedlich ingplementiert 
sein. Beispielsweise kOnnen direkt tlber jeder Halbleiterschicht 
Verdrahtungsebenen und/ oder eine globale Verdr ah tungs ebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

35 

Um eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesaiatschaltung, also alle Halbleiterstrvikturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustleistung, aller Halbleiterstrukttirebenen 
40 zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
t}berhitzung \ind dem damit verbundenen Ausfall der Schaltung fOhrt. 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anforderungen entsprochen 
werden . 

45 Beispielsweise ist filx die vorgeschlagene Architektur eine Ebene von 
liogikhalbleiter strukturen und eine weitere Ebene von 

Speicherhalbleiterstimkturen vorzusehen, die fUr diese Anforderungen geeignet 
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sind. wahrend die irregularen und wenig redundanten Logildialbleiterstrukturen 
eine vergleichsweise hohe Fehlerquote mit hoher Verlustlei stung aufweisen, 
kannen Speicherhalbleiterstrukturen vergleichsweise redundant mt niederer 
Fehlerquote und durch geeignete Speicherverfahren (2. B. DRAM) auch mit 
5 geringer Verlustleistung implementiert werden. Es wird explizit darauf 

hingewiesen, dafi es mdglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherpiatze und/oder alle Logikhalbleiterstrukturen voll funktional sind; 
es ist lediglich erf order lich, Mindestanf orderungen sicherzustellen und/oder 
eine ordnungsgemSlSe Verwaltung, Redundauizen sind bevorzugt ftlr beide 
10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach Ubereinander liegenden Halbleister strukturen 
kann nach unterschiedlichen Ver£ahren erfolgen. Neben dem bereits 
beschriebenen Verfahren des Aufbringens einer weiteren Halbleiterebene tlber 

15 einer Isolierschicht, was z. B. diirch Aufdampfen und/oder Aufkristallisieren 
erfolgen kann, sind auch thermische Oder inechanische Verbindungen m^glich, 
indem z. B. die aufzubringende Siliziumstruktur aufgelOtet- oder aufgeklebt 
wird. Zum AuflSten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiter chips mit GehSusen bekannt sind. 

20 Dabei handelt es sich beispielsweise um Reflow-L^tung oder Thermokompression. 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden mSglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann* 
Voraussetzung hierftir ist, dass die Siliziumstrukturen unterschiedliche 
Gr&fien aufweisen, sodass die Drdhte von einer Siliziumstrukturoberf lS,che zur 

25 n^chsten gedrahtet werden kdnnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist, damit diese mittels Wirebond noch realisiert 
werden kOnnen. 

Zur pptimierimg der Ausbeute kann insbesondere das Redundanzverfahren nach DE 

30 197 57 200.6-33 angewendet werden. Es soil erwclhnt sein, dass das Verfahren 
nach DE 197 57 200*6-33 fttr alle PAEs vorgesehen werden kann, also z. B. ftir 
ALU-PAEs genauso wie fUr RAM- PAEs. Mit anderen Worten kdnnen far s^tliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverfahren sind in^lementlerbar. 

35 FUr PAEs mit hauptsachtlich f eingranularen Strukturen, also z. B. Speicher 

(RAM-PAEs) Oder FPGAs ist es von Vorteil, diese f eingranularen Strukturen mit 
einer entsprechend feingranulcuren Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-Struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die feingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 

(bzw. FPGA-Zellen) redxmdante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erfordemisse einer redundanten Struktur 
angepa&t. Der Aufbau redundanter Strukturen ftlr feingreuiulare Zellen, wie z. 

45 B. speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Ftlr 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistiang laSt sich nach den Verfahren von DE 196 51 075.9-53 iind 
DE 101 35 210.7-53 erheblich minimieren, wodurch sehr hohe 
Integrationsdichten ermaglicht werden. 

5 Bs soil darauf hingewiesen warden/ dass die Anzahl der iibereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenzt ist. Hit for tschrei tender 
technischer Entwicklung und Optimierung ist eine steigende, auch sehr groSe 
Zahl von tlbereinanderliegenden Easenen realisierbar . 

10 Die Ebenenauf teilung xmiS deOsei, weder bei einer zweilagigen, noch bei einer 
mehrlagigen Struktur auf eine ALU- Speicher- auf tei lung limitiert sein. Bereits 
bei zweilagigen Strukt\iren kann es sinnvoll sein den Speicher zusanmen mit 
den MjUs in eine I^age zu legen und die andere Lage kon^lett fUr die 
Bussysteme oder die Bussysteme und lO-Ansteuerungen (lOAGs) zu verwenden. Die 

15 Bussysteme kOnnen dabei tiber die einfache Verdrahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
Verstarkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(KDY/ACK-Steuerung) , die jewells Halbleiterstrukturen zu deren Realisierung 
ben6tigen enthalten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene fttr die Konfigurationsspeicher 
und/oder Konfigurationsregister und/oder CT und deren Speicher vorzusehen. 

Figur 6 zeigt eine Ingplementierung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE iirplementiert . Der gesamte Registersatz 

25 (R0..Rn, Rpp, Rsp, Rfp, Rap) ist in der ROP-PAE. untergebracht.. Zugriffe auf 
die Register durch die ALU sind schnell und mit geringem Auf wand mbglich. 
Adressen \jLnd Daten kOnnen direkt von der ALU an den Speicher Ubertragen 
werden, ohne ein Bussystem auSerhalb der ROP-PAE wie z. B. 0105 zu benOtigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte lO-Channel zur 

30 Datenttbertragung mit der Peripherie auf (beispielsweise 0601, 0602). 

Datenverbindimgen zu den restlichen PAEs kSnnen wie bereits bekannt d\irch 
FREG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne ROckkopplung des ALU~Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendxmg eines ROP-PAE extemen 
Busses (z.B. 0105) und einer Rtickkopplung d\irch ein BREG, wie bereits bekannt 
erfolgen (0605) . 

40 Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindxmgen zur 
DatenUbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinainder montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Silizium, 0704), 

45 mehreren Metalllagen zur Realisierung von Verbindungsleitungen (z. B. 

Al\aminivim und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und gegentU^er 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsfahigen Isolierschicht 
0706. In die Isolierschicht en sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindxing der einzelnen Ebenenr sogenannte ViaS/ eingeftigt. 

5 In Figur 7b sind die beiden Dices ndttels einer Art Flip -Chip- Techno logie 
miteinander verbimden, wobei die t)bertragung von Signalen durch sogenannte 
BuirK>s nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip -Technologie gegebenen MeSglichkeiten des Anschlufi von Bumps (0711) auf 
der jeweils obersten Metalllage soli hier die besondere erfindungsgemaiSe 

10 Ausgestaltung gezeigt werden, die Buntps unterhalb der Halbleiterschicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbind\angen (z.B. 
Aluminium oder Kupfer) , also Vias (0712), durch die Siliziumschicht nach 
unten geftlhrt. Die Durchftlhrung erfolgt bevorzugt durch Atzen von 
entsprechenden Ldchern in die Halbleiterebene. Zwischen den Verbindungen und 

15 der Halbleiterschicht wird eine Isolierung eingefUgt. 

Die DurchfOhrung kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zun^chst Wannen 
(0731) in die Halbleiterschicht geatzt, die mit einer Isolier\ing gefUllt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in diesem Fall dtinner ausfallen kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zxinSchst durch Atzen und/oder Schleifen mSglichst eben gemacht. Das 
Aufbringen der Halbleiterschicht kann durch Aufdampfen, Aufziehen von 
Kristallen oder bevorzugt diirch Aufkleben oder klebeahnlichen Verbindungen 
aufgebracht. wesentlich, v. a, bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur imd das Verbindungsxnaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erforderlich, um 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darunterliegenden 
Isolierschicht zu fChren. 

Die Durchftihrung der Kontakte erfolgt gemaS Figur 7d z. B. durch das EinStzen 
schmaler Kanaie, in die ein Isoliermaterial eingebracht wird. Danach wird in 
35 einem weiteren Schritt in das Isoliermatierial ein sclimaleres Via eingefagt, 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grdsserer Wannen (0731) vor, welche 
mit Isoliermaterial gefUllt werden. In die Wannen werden dann ggf • mehrere 
40 Vias (0712) wie beschrieben eingefUgt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel. Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Utarandung. Dazwlschen liegen 
45 die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind gr5£ere Stapel, z.B. mit 3,4, Oder mehr Ebenen 
mOglich. 
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Die mehrfache beschriebene Auftrennung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schalteinheiten 
5 und der lO-Struktur von den ALUs \ind Speichem, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der imtersten Etoene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustleistung an den auJSeren Rtodem der Stapel untergebracht . Besonders 
10 hierfttr wird Schutz beansprucht, da dadurch eine besonders optiinale 

warmeabfuhr itiQglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mittleren Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mittleren Bbenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
15 10 sind zur optimalen Wcbnneabfuhr in den RSndern untergebracht. 

lOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (lORAM-PAEs) mit einem dedizierten 
Anschluss an externe Einheiten wie z.B. Peripherie \ind/oder Speicher bekannt. 

20 Weiterhin sind aus DE 196 54 595.1-53 xind DE 102 06 653.1 dedizierte 
Einheiten (z. B, Interf ace-Baugruppen (IBG)) zum Anschluss von extemen 
Einheiten wie z. B. Peripherie und/oder Speicher bekannt - 
Beide Verfahren weisen das Problem au£^ dass ein zusatzlicher Aufwand zur 
Datenkoznmimikation zwischen PAESr Insbesondere da tenverarbei tender und/oder 

25 datenberechnender PAEs \md extemen Einheiten betrieben werden muss, indem 
die Da ten explizit zwischen den PAEs und den IBGs und/oder lORAM-PAEs 
Ubertragen werden mils sen. 

Es wird nunmehr erfindungsgem^fi vorgeschlagen und wie berelts vorstehend 

30 mehrfach erwahnt fOr beliebige PAEs, insbesondere jedoch fUr 

da tenverarbei tende und/oder datenberechnende PAEs (z. B. ALU-PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspeichemde PAEs (RAM-PAEs nach DE 
100 50 442.5 ) einen oder mehrere dedizierten Anschlttsse (lO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorz\isehen. Dadurch 

35 ist eine direkte Kommunikationsmeglichkeit der PAEs, die nachfolgend lOx-PAEs 
genannt werden, und extemen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (extemem Speicher und/oder lO-Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konfigurierl^aren Bussysteme der PAEs 

40 untereinander (BUS) mUssen nicht mit den lO-Datentransfers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des lO-diannel die 
Adressierung der Daten fOr oder einzelne PAEs sehr viel einfacher 
durchgeftihrt werden, als dies mittels des BUS mC5glich wSre. 
Dies 3cann bevorzugt dadurch realisiert sein, dass jede an einen lO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse Uber den XO-Channel Ubertragen wird und jede Einheit diese Adresse 
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mit ihrer eigenen vergleicht. Wenn die Adressen tlbereinstiramen, ist die 
Einheit adressiert und die Daten sind ftir diese Einheit bestiinmt. 
Bevorzugt kann jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit ftir die die Daten bestiinmt sind, sondeim auch ihre eigene Adresse 
5 tibertragen, um eine Identifikation des Senders zu ermOglichen. 

Besonders ef fizient kann das Vorsehen von lO-Channels ftir nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs mit 
IO-Channel-Eweiter\ang innerhalb einer Anordnung von PAEs (PAE-Array, PA) 
10 vorzusehen. Dadurch wird eine verbesserte Fiachen- und Kostenef fizienz 
gegentiber der Ixnplementierung der lO-Channel-Erweitenong in alle PAEs 
erreicht . 

PAEs, die besonders hohe Korraminikationsanf orderungen aufweisen, k&nnen 
15 appXikationsabh&igig auch an znehrere XO-Channel angeschlossen sein. 

Die dedizieren XO-Channels k&nnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein, z. B. insbesondere nach DE 197 04 742.4 oder als paralleles 
Standardbussystem wie Rapid- 10, PCI, AMBA oder serielles Standardbus system 
20 wie USB, Firewire, Ethernet. 

Besonders leistvmgsfahig kann die Implementierung von lO-Channels in PAEs 
dann sein, wenn diese nicht direkt an die extemen Binheiten geftihrt sind, 
sondem zun£lchst an eine lO-Verwaltwgseinheit (I0A6) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653.1 oder der lOAG nach DE 196 54 595.1- 
53 aufgebaut sein kaim. Der Vorzug liegt darin, dass ein einf aches internes 
Busprotokoll zur Steuerung der lO-Channels verwendet werden kann. Hbenso wird 
nur eine geringe "Intelligenz" in jeder einen 10 -Channel aufweisenden PAE 
bend tig t, wodurch die PAEs j swells flolchenmcL&ig klein und unaufwendig zu 

30 programmieren sind. 

Die eigentliche Veirwaltung und Ansteuerung der extemen Einheiten wird in den 
10 AGs durchgeftihrt, die durchaus gr61Ser xmd aufwendiger ausgestaltet sein 
kdnnen . 

35 Die lOAGs k6nnen zur Erftlllung ihrer Aufgabe selbst eigene Sequenzer umd/oder 
Mikrokontroller und ggf . auch eigenen Speicher aufweisen. Insbesondere kann 
die I0A6 auch Speicherxaanagementeinheiten imd Adresstlbersetztingseinheiten 
aufweisen. Je nach Applikation kOnnen Interruptkontr oiler wie 2. B. nach dem 
Stand der Technik bekannte (18259) in der lOAG inqplementiert sein, die 

40 Interrupts ggf. auf Triggers ignale nach DE 197 04 728.9 tlbersetzen. 

SIMD PAEs 

Bei der Verwendung von rekonf igurierbaren Technologien zur Verarbeitung von 
45 Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 

maglichst hohe Rechenlei stung zu erhalten, komplexe ALUs erforderlich, wobei 
der Auf wand far die Rekonf igurat ion minimal sein sollte; (2) es soil ten die 
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ALUs mOglichst einfach iind feingranular sein, urn eine effiziente 
Datenverarbeitung auf Bitebene zu ermfiglichen; (3) es sollte die 
Rekonfigiiratlon imd Datenverwaltung derart intelligent iind schnell erfolgen* 
daB sie effizient und einfach zu progranmieren ist. 

5 

Bisherige Technologien verv^enden entweder a) sehr kleine ALUs mit venig 
Rekon£igurationsunterstUtz\ing (FPGAs) und sind auf Bitebene effizient oder b) 
groSe ALUs (Cameleon) mit wenig Rekonf igurationsuntersttitzung, oder c) eine 
Mischung aus grol^n ALUs und kleinen ALUs mit Rekonf igurationsuntersttitzung 
10 MXid Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsf^higste Technik darstellt, soil auf ihr 
aufbauend ein optimiertes Verfahren geschaffen werden. Es soil ausdrUcklich 
deirauf bingewiesen werden^ dafi dieses Verfahren ebenfalls fUr die anderen 
Architekturen eingesetzt werden Icann. 

15 

Der Fiachenaufwand zur effizienten Steuerung von Rekonfigurationen ist mit 
einer Mfenge von ca. 10.000 bis 40.000 Gattem pro PAE vergleichsweise hoch. 
Unterhalb dieser Gatterraenge lassen sich in der Kegel nur einfache 
Ablaufsteuerungen reals ieren, die die Programmierbarkeit von VPUs erheblich 
20 einschr&iken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofem auf eine besonders schnelle Rekonf iguration abgezielt wird, mtlssen 
zusatzliche Speicher vorgesehen werden, wodurch die erforderliche Gattermenge 
nochroals erheblich ansteigt. 

25 Um ein ordentliches Verbal tnis zwischen Rekonf igur at ionsauf wand und 

Rechenleistung zu erhalten, ist somit der Einsatz von groSen ALUs (viel 
Funktionalit^t und/oder groBe Bitbreite) zwingend erforderlich. Werden die 
ALUs jedoch zu grofi, sinkt die nutzbare parallels Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4 -bit) ist der Aufwand zur Konfiguration 

30 aufwendiger Funktionen (z.B. 32 -bit Multiplikation) zu hoch. Xnsbesondere der 
Verdrahtungsaufwand w^chst in kommerziell nicht mehr sinnvolle Bereiche. 

SIMP Rechenwerke 

35 Um ein ideales Verhaitnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdrahtungsaufwand und der Konfiguration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken innerhalb von ALU-PAEs (also 
insbesondere der in dieser Erfindung offenbarten PAEs, ebenso wie in PAEs 
nach DE 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen. Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, daE n einzelne Bldcke der Breite b 
a m/n entstehen. Durch Konfiguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in einen oder 
mehrere B16cke, jeweils gleicher Oder unterschiedlicher Breite zerlegt sein 
soil. Mit euideren Worten kann ein Rechenwerk auch derart zerlegt sein, dafi 

45 innerhalb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4-bit) . 
Die Daten werden dereurt zwischen den PAEs Ubertragen, dafi die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbreite m zusammengefafit werden 
und als Paket tiber das Netzwerk tlbertragen werden. 

Das Netzverk tlbertrclgt immer ein ko]^plettes Paket, d.h. alle Datenworte 
iiinerhalb eines Paketes, und werden. nach dem bekannte Handshake -Verfahr en 
5 tlbertragen. Einzelne Datenworte innerhalb des Paketes kOnnen dabei auch 

unbenutzt sein, d.h. keine Information enthalten. Dies kann durcb zusStzliche 
Status leitungen \jnd/oder Handshakes ignalen wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP Bussvsteme 

FUr einen ef fizienten Qinsatz der von SIMD-Rechenwerken ist eine flexible tind 
effiziente Umsortierung der SIMD-WORD untereinander innerhalb eines Busses 
Oder zwischen unterschiedlichen Bussen erforderlich. 

15 Die Busschalter nach Figur llkSnnen derart modifiziert werden, dafi eine 
flexible Verne tzung der einzelnen SIMD-WORD mdglich ist. Dazu werden die 
Busse Ober beispielsweise Multiplexer, Busschalter, Transmissiongates, Pass- 
Transistoren (nachfolgend unter dem Begriff Multiplexer zusammengefeiBt) 
entsprechend den Rechenwerken teilbar ausgelegt, derart dafi durch 

20 Ronfiguration die Teilung bestimcnt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondem 
n einzelne Multiplexer der Breite b = m/n. Es ist nunmehr maglich, die 
Datenbusse fUr b bit Breite zu konfigurieren. Durch die Matrixstruktur der 
Busse (Figur 11} ist die Uhisortierung der Daten ebenfalls mdglich, wie in 

25 Figur 12a dargestellt. 

Die Hcindshakes der Busse werden logisch derart verkntlpft, dafi ein gemeinsamer 
Handshake fUr den neu geordneten Bus aus den Handshakes der ursprOnglichen 
Busse generiert wird. Beispielsweise kann ein RDY ftlr einen neu sortierten 

30 Bus aus einer logischen UND-VerknUpfung aller RDYs der Daten fOr diesen Bus 
liefemden Busse generiert werden. Sbenso Icann beispielsweise das ACK eines 
Daten liefemden Busses aus einer UND-Verkntipfung der ACKs aller Busse 
generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Implementieriuig geeignete VerknUpfungen dergestalt zu wahlen, dass diese den 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Ausftthrungsvariante f inden die Verknttpfungen der Handshakes 

innerhalb eines jeden Busknotens statt. Dadurch wird es mOglich, einem 
Bussystem der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake- Protokoll zuzuordnen. 

In einer weiteren besonders bevorzugten Ausgestaltung werden s&ntliche 
Bussysteme in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) best eh t nunmehr ein Ein-/Ausgcmgsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SIMD-Wortbreite 
von 8 tatsachlich 3x4 8bit Eingangsbusse und 2x4 Bbit Ausgangsbusse. 
Jeder der Teilbusse welst bevorzugt sdmtliche verwendeten Handshake- und 
Steuersignale auf , beispielsweise RDY/ACK und der Reconfig-Trigger nach DE 
5 197 04 728.9 und ein globales Reset Signal, etc. 

Der Ausgeuig einer PAE versendet bevorzugt dieselben Steuersignalen fUr 
ScUntliche n Teil-Busse. Eingehende Quittieriingssignale aller Teilbusse werden 
bevorzugt miteinander logisch verkntlpft, z. B. durch eine DND-Punktion. Die 
Bussysteme kfinnen jeden Teilbus frei verschalten und unabh&igig routen. Die 
10 Bussysteme und insbesondere die Busknoten verarbeiten und/oder verknttpfen die 
Handshake- Signale der einzelnen Busse unabMngig ihres Routings, ihrer 
TVnordnung und Sortierixag nicht. 

Bei in einer PAE eingehenden Da ten werden die Steuersignale s&ntlicher n 
Teilbusse derart miteinander verkntipft, dass ein allgemeingUltiges 

15 Steuersignal quasi als Bussteuersignal ftlr den Datenpfad generiert wird. 
Beispielsweise kOnnen in einer "dependend" Betriebsart RdyHold-Stuf en fOr 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche Rd^old- 
Stufen anstehende Daten signal isier en, werden diese von der PAE tlbemoinmen . 
In einer " independend " Betriebseirt werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wodurch der Teilbus 
sofort fUr eine n^chste DatenUbertragung frei ist. Das Vorhandensein aller 
erforderlichen Daten von alien Teilbussen in den Eingangsregistem wird 
innerhalb der PAE durch geeignete logische Verkntlpfung der fUr jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAS 

25 mit der Datenverarbeitung beginnt. 

Der wesentliche daraus resultierende Vorteil dieses Verfahrens ist, dass die 
SIMD-Eigenschaft von PAEs keinerlei besonderen Einfliifi auf das verwendete 
Bussystem aufweist. Es werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) bendtigt. Die Verschaltung selbst blelbt unbeictthrt. Die PAEs 
verkntlpfen und verwalten die Steuerleitungen lokal. Dadurch entfailt der 
zusStzliche Hardwareaufwand in den Bussystemen zur Verwaltung tind/oder 
Verkniipfung der Steuerleitungen. 

35 Figur 11 zeigt einen mfiglichen und besonders bevorzugten Aufbau einer 

Busstruktur ftir VPU-Architekturen . Die Ausgabeschaltung einer Funktionszelle 
z. B. (PAE , FRE0/BRE6) (1103, entspricht 0803a, b) ist iXb&r einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschaltungen der Funktionszellen (1101, 

40 entspricht 0801, 0802) tiber einen vertikalen Bus Inf ormationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestellt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein "Auftrennen" eines Busses des horizontalen 

45 Bussystems 1102 tind das Einfiigen von horizontalen Schalteim (1112), die durch 
Switches, Transmission- Gates, Multiplexer Oder Slhnlichen geeigneten 
Bauelementen realisiert sein kOnnen. Abh&igig von dem Wert eines Dekoders 
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und/oder Konf igurationsbits (angedeutet durch das Schalter symbol 1113), das 
entsprechend der bekannten Konf igurat ions verfahren bevorzugt in einem 
Konfigurationsregister der PAE angeordnet ist: und konfiguriert wird, 
verbindet der Schalter entweder die beiden HSlften des horizontalen Busses 
5 1102 miteinander oder schaltet den Bus 1111 auf die eine HSlfte von 1102 auf , 
die andere Haifte von 1102 ist dann unterbrochen und wird nicht 
weitergeleitet . Die Schaltiing wird bevorzugt ftlr jeden Bus des horizontalen 
Bussys terns verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgriff von Daten von 1102 

10 und zur Weiterleitung derer an 1101. Ober vertikale Schalter (1122)/ die 
durch Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein k5nnen, werden Daten bitweise von den Bussen des 
horizontalen Bussys terns (1102) abgegriffen und auf den vertikalen Eingangsbus 
(1121) zur Eingabeschaltung 1101 tibertragen. Die Ansteuerung der vertikalen 

15 Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konf igurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in 
Konf igurationsregistem der PAE angeordnet sind und konfiguriert werden. 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen n:l 

20 DatenObergSnge zu, d.h. mehrere Busse kdnnen zu einem Bus zusaxomengefafit 
werden, d.h, die Daten mehrer Busse werden auf einem Bus zusaxnmengeftttirt. 
Fig. 11c zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
(1102) . Jeder horizontale Bus einzeln und je ftir sich kann an der 
Ausgabeseite der PAB-Kante aufgetrennt werden. Eine Auftrennung kazm durch 

25 Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soli. 
Je nach Konf igurat ionsbit 1132, das bevorzugt fOr jeden Bus des Bussys tems je 
einzeln zur Verftlgung steht, wird die Datentibertragung auf das 
danebenliegende Bussystem (1131) f reigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltem nach Figur 11a 

30 realisiert, indem die Information des Konf igurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) tUsertragen wird und 
entsprechend die Schalter zur Weiterleitxmg erm£lchtigt (enabled) oder die 
Schalter sperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bus system entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. Jede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschalt\ing 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhtogig geroutet werden k{&nnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figuren lla-c fUr jeden Bus 
derart getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltet' wird. Dadurch ist das Bussystem feingranular 
verschaltbar. 
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Figur 12b zeigt eine SIMD-Datenverarbeitung, bei welcher scUntliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb einer 
PAE in die Teillausse getrennt und in den SIMD-ALUs (1213, 1214} getrennt 
verarbeitet. Die gemeinsaitien Handshakes steuern die Ablaufsteuerung (1215) 
5 der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher s£Untliche Busse 

vollkommen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223, 1224) getrennt verarbeitet. Die getrennten 
10 Handshakes steuern die Ablaufsteuerung (1225) der PAEs an, bzw. werden von 
dieser generiert. 



Einsatz von FPGAs als ALU-Core 
15 In PACT13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA oder PPGA-Shnliche Struktutr in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAH gemaB den FPGA Konf igurationsinethoden nach 
dem Stand der Technik konf iguriert, d, h. die erweiterten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden auf die FPGA- 
20 Struktur keine Anwendxing. Dadurch sind Auf wand iind Kosten ftir die 

Konf igurationssteuerung der verbal tnism^fiig kleinen FPGA-Zellen gering. Die 
PAE allerdings, die die FPGA-Zellen enthait, verhait sich gemaE des VPU- 
Konfigurationsverfahrens nach den o. g. Schriften. Dadurch- ist die FPGA- 
Struktur in der PAE-Struktur gekapselt \and verhait sich wie ein PAE-Objekt 
25 mit vielen Konf igurationsregis tern. 

Dadurch lassen sich auch beliebige Operationen auf ein Array aus FPGAs 
abbilden. GemaS DE 101 35 210.7-53 ist eine Mischung aus ALU-PAEs und FPGA- 
PAEs innerhalb einer VPU mOglich und durchaus sinnvoll. 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konfigurationsregistem ftir die FP(3A-Zellen sinnvoll ist, da deren Anzahl 
sehr hoch ist. Gegebenenfalls werden Konf igurationsregis ter zum schnellen 
Uinkonfigurieren einer FPGA- PAE gemaS DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File oder FIFO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die FPGA-Zellen 
geladen. 

Es hat sich mittlerweile als besonders vorteilhaft herausgestellt, weim 
innerhalb einer ALU-PAE eine FPGA struktur der ALU zugeordnet wird, indem die 
40 FPGA-Struktur vor und/oder nach und/oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine Ausftlhrung in welcher die FPGA-Struktur der ALU 

nachgeschaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA-Strukturen verwendet 
werden mUssen, da samtliche eurithnetischen Operationen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kosten/ Performance Effizienz 

erreicht. Um kleine Wortbrei ten zu unterstUtzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschriebenen SIMD-ALUs einzusetzen. 



wo 03/036507 



PCT/EP02/10572 



Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lassen sich 
insbesondere Correlatoren und PNG-Generatoren besonders effizient aufbauen. 

Der Einsatz von VPU Architekturen bietet sich mi ttleorweile' insbesondere ftir 
5 den Ersatz von ASICs bei mittleren und niederen Sttickzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf , dass die 
Applikat ions f elder sehr klar definiert sind und hSufig nur einige wenige 
Applikationen auf den Bausteinen ausgeftihrt werden. Besonders diese 
Einsatzgebiete benOtigen Mufig feingranulare FPGA-Strukturen zur bitweisen 

10 Verarbeitung von Daten. 

Durch die Limitierung auf wenige Anwendungen sind hier die mOglichen 
Konfigurationen der FPGAs ebenfalls sehr begrenzt xand vorhersagbar. 
Es wurde erkannt, dass es beispielsweise insbesondere fUr diese 
Einsatzgebiete lohnend ist, die Rekon figuration der FPGA-Strukturen von der 

15 schnellen Rekonfiguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Worten werden ftir die FPGAs langsamere (z« B. herk5inmliche serielle) 
Rekonfigurationsverfahren verwendet, die £Lu&erst kosten- imd f lacheneff izient 
realisierbar sind. 

Dazu kann (1) ein vollkommen separates Konfigurationssystem bes tehend aus 
20 Bussystem und Konfigurationskontrollem aufgebaut werden, wie dies von FPGAs 
nach dem Stand der Technik bekannt ist. (2) kOnnen die 

Konfigurationsressourcen der VPU Technologie benutzt werden« ohne dass jedoch 
Ressource ftir besondere beschleunigende Massnahmen zur Verftlgung gestellt 
werden. Beispielsweise kann der Zugriff auf den FIIiMO nach DE 196 54 593.5-53 

25 , DE 198 07 872,2 ftir FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Konfigurationsregisters tacks nach DE 100 28 397.7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Untersttltzung der schnellen Wave- 
Rekonfiguration nach DE 199 26 538,0 , DE 100 28 397.7 entf alien. Es ist 
etwa mOglich, einem FPGA- Array eine PAE zur Utakonfigurienong zuzuordnen. Hier 

30 muE lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 
was wie vors tehend beschreiben, durch PAE-gesteuerten, eigenstSndigen Zugriff 
auf Daten von auEen geschehen keuin. 

Insbesondere bietet es sich aus Kostengrtlnden an anstatt der mehrfach 
rekonf igurierbaren Architekturen res sour censparende "einmal konfigurierbare" 

35 Architekturen einzusetzen. Die VPU- Bausteine werden dann einmal vor ihrer 
Aus lief erung an den Kunden oder beim Kunden bzw. durch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre dtirchzuftthrende 
Punktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unab^nderlich, w£lhrend sMmtliche verbleibenden Funktionen, wie die 

40 der ALUs und deren Vemetzung, weiterhin vollstandig laufzeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf igurierbare" Technologien bieten sich besonders die bekaimten 
ROM, EPROM, EEPROM, FLASH basierenden Verfahren an. Es soil insbesondere 
erwcUmt sein, dass sich die bekaxmten Fuse und Antifuse-Verfahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger "einmal 
programmierbarer* FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derar tiger Strukturen soli hier nicht waiter 
eingegangen werden, da dieser durch den einschiagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firmen, hinreichend bekannt ist. 

5 Figur 8 zeigt beispielhaft eine erfindungsgexnclfie PAE. Daurgestellt ist der 
Datenpfad der PAE, Die Verbindung zu dem Bussystem 0105 wird durch die 
bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 \and die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 realisiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus feingranularen 

10 FPGA-Zellen (0805) , die tiber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur aufgeschaltet, die 
' Busstruktur wiederum ist mit 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Biypass des Ausgangs von 0804 dlrekt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen kttnnen mehrere Stufen Logik konfiguriert werden, 

insbesondere stotliche oder einige der folgenden Funktionen: Kultiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister, 
Register, Boolsche Lookup-Tabellen. 

Die FPGA-Zellen (0805) kdnnen durch den Konf igurationsbus (0404) der PAE 
20 konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 

Baugruppen, wie z. B. Konf igurationss tacks (0406) nicht zur Konf iguration von 

FPGA-Zellen benutzt. Diese Baugruppen werden ggf . ffir derartige 

Konf igxirationsdaten passiv geschaltet oder die Konfigurationsdaten werden an 

ihnen vorbeigeleitet . 
25 In einer besonderen Ausgestaltung ist eine permcinente einmalige Konf iguration 

der PPGA-Zellen unter Verwendving von ROM-Elementen wie z. B. EPROM, EEPROM, 

Flash-ROM Oder Fuse^/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt xnagliche erf indungsgemeUSe Ausgestaltungen von PAEs. Es soli 
30 ausdrttcklich darauf hingewiesen werden, dass die Ausgestaltung in Figtir 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE inplementiert 
sein k6nnen. 

Figur 9a zeigt den AnschlxiS eines Reglsterfiles (0901) (z.B. R0..Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und PPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Registem 0901 geftihrt und dort je 

nach Operation eingespeichert . Die Register 0901 werden -liber Muliplexer 
(0903, 0904) je nach durchzuff&renden Operation auf die Eing&ige der ALU 
40 geftihrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusStzliche 
Aufschalteinheit (0911) ftir einen dedizierten globalen B\is (0912) (z.B. 10- 
Channel) ixnplexnentiert ist. Die Eirgebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 geftihrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) tlbertragen. FUr die PAE bestiramte Daten von 0912 
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werden ilber Muliplexer (0903, 0904) je nach durchzuftlhrenden Operation auf 
die Eingange der ALU geftihrt. 

Optional kann die Aufschalteeinheit 0911 tUber die Busaufschalteeinheiten 0913 
und 0914 Daten direkt von dem Bussystem 0105 lesen Oder auf dieses 
5 tibertragen . 

Figur 10a zeigt die Verwendiing von dedizierten globalen Bussystemen innerhalb 
eines Arrays aus PAEs (1001) . Insoweit entspricht die Dcurstellving des PAs aus 
Figur 1 (0101) . Jeweils eine Menge von PAEs (1001) ist an die globalen 

10 dedizierten Bussysteme 1002, 1003, 1004 angeschlossen luid kann Daten auf 
diese Senden oder von diesen Einpfangen. Die Dateniibertragung kann sowohl 
zwischen den PAEs, als auch zwiscben PAEs und 10 stattfinden, Es ist 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bussysteme 
gleichzeitig angeschlossen sein kOnnen, wShrend andere PAEs m5glicherweise 

15 keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den AnschluS eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays aus PAEs 
(Old) mit einigen PAEs (1001) verbunden ist, an aufierhalb des 0101 liegende, 
ggf . auch bausteinexteme Baugruppen. Die Baugruppen ktinnen beispielsweise 

20 Peripherie (1011) und/oder Speicher (1012) sein. Zum Anschlufi der aui^rhalb 
liegenden Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTIi, LVDS, etc.) stattfinden, 

Figur 10c zeigt ein Beispiel fUr den Anschl\ifi eines globalen dedizierten 
25 Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine Interface- 
Baugruppe (1021) . Die Znterface-Baugruppe Ubersetzt die Protokolle wd/oder 
Signale des intemen dedizierten Busses auf einen oder mehrere aulSerhalb 
liegenden Busse. In dem aufgezeigten Beispiel sind 2 auEerhalb liegende Busse 
30 (1022, 1023) iinplementiert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicherbussystem fOr Speicher 
(1024) wie SDR-KAMs, DDR-HA^, RAMBUS o.S.. sein, wShrend 1023 ein 
Peripheriebussystem fOr Peripherie- und/oder XO-GereLte (1025) darstellt, wie 
z. B. PCI Oder ein serielles Protokoll wie USB, FireWire, Ethernet. 

35 

Konf icfuration komplexer Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) kfinnen durch die 
geeignete Verschaltung \md Gruppieriuig von konf igurierbaren Zellen (PAEs) 
40 mdglicherweise auch unterschiedlicher Bauart (RAM- PAEs, ALU- PAEs, Bussen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durcb eine geeignete 
Verschaltung von mehreren ALU-PAEs, die die arithmetischen (>perationen tUser 
Exponent und Mantisse durchfdhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des Anmelders (XPP-Technologie) integrierten Forwaurd- und 
Backward-Register (FREG/BREG) zugeordnet, um die notwendigen Normierungen 
diirch Schiebeoperationen der in den FREG/BREG angeordneten Bcunrel -Shifter 
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durchzufllhren. Damit lassen sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Piachenef f izienz aufbauen. 
Ein Vorteil des Verfahrens liegt darin, dass keine Siliziura-FlSche ftir fast 
integrierte Floating-Point Rechenwerke verwendet warden muss. Da Floating- 
5 Point-Operationen relativ zu den Integer-Operationen nur selten gebraucht 
wird, steigt damit das Kosten/Nutzen-Verhaitnis erheblich an. 
Coir¥>iler, die Hochsprachenprogramme auf eine VPU tlbersetzen, kCimen diirch 
Makroexpansion und/oder mittels Lauf zeit-Bibliotheken entsprechende 
vorgefertigte komplexe Strukturen in den Maschinencode (z. B. KML) 
10 {Ibemehmen . 

Ptir Maschinencode-Prograrnme (z. B. NML) bieten sich besonders Iiibrary-Calls 
auf Bibliotheken an, die die entsprechenden komplexen Funktionen vorgefertigt 
en thai ten. 



15 

Statemachines Ober RAM-PAEs 

Mit einem Array aus PAEs verbundene RAM-PAEs kttnnen zum Aufbau von Sequenzem 
eingesetzt werden. Das Grxmdprinzip beruht darauf , dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zurttckgekoppelt wird. Die RUckkopplung 
20 erfolgt bevorzugt tiber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Telle der Ausgangsdaten (CONTROL-Signale) k&nnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an externa Gerate tibertragen 

25 werden, um dort bestiimtite VorgSnge auszulSsen. Besonders bevorzugt sind zwei 
tiber tragungsar ten, die zumeist gemeinsam angewendet werden: 
a) die tibertragung tiber einen Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemaS der vorstehenden Erlauterung ausgestaltet, wodurch eine teilweise 
tibertragung der Ausgangsdaten besonders effizient realisierbar ist. 

30 b) die Obertragung tiber einen Triggerbus, dessen bevorzugte Ausgestaltung und 
Arbeitsweise in PACT08 beschrieben ist. tJber Triggerbusse kGnnen Zustande und 
Bedingungen zur Ablaufsteuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch extemen GerSten besonders effizient tU^ertragen werden. 



35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt(Darstellung: hOherwertige Bits ... niederwertig Bits): 
Adresse : 

Adresse des aktuellen Zyklus 



Daten : 



40 



Adresse des nachsten Zyklus 



CONTROL- Si gnale 



Es bleibt zu erwahnen, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend ztigegriffen. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konfigurationseinhelt 
vorkonfiguriert. Deshalb kann der Speicher insbesondere auch als 
45 nichtfltlchtiger einmal prograranderbarer Speicher mit ROM, EPROM, EEPROM, 

40 
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Flash Zellen oder basierend auf Fuse oder Antifuse Technologien aufgebaut 
sein. Der Speicher wird dann, wie vorab bereits beschriebeii/ vor der 
Auslieferung an den Kunden oder beixn Kunden personcdisiert, d.h. 
prograxnmiert . 

Ein Speicher zugriff diirch andere PAEs ist grunds&tzllch mdglich, \m den 
Sequenzer z.B. im Betrieb zu modif izieren, soil aber aufgrund des begrenzten 
Einsatzbereichs hier nicht welter detailliert ausge£tUirt werden. 



10 Der erf indiongsgemafie Sequenzer kann durch folgende Erweiterungen in seiner 

Abfolge von Zyklen auf Ereignisse reagieren und insbesondere bedingte SprHnge 
durchf tlhren : 

Ein Teili bevorzugt der niederwertige, der Eingemgsadressen zu dem Speicher 
wird als Eingang ftlr weitere Zustandssignale verwendet. Diese Zustandssignale 

15 k6imen durch die vorstehenden tJbertragungsarten Obertragen werden \md soiait 
Daten oder Trigger sein. Bei der Selection des nachfolgenden Zyklus wird 
nunmehr eine mfigliche Menge von Zyklen durch die DatenrUckkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der bestiinmte Zyklus wird dann aus 
der m()glichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 



25 



Daraus resultiert folgender Aufbau der Eingangsadressen« bzw. Ausgangsdaten 
wie folgt (Darstellung: hOherwertige Bits ... niederwertig Bits): 
Adresse: 



Adresse des 
aktuellen Zyklus 



Zustandssignale 



Daten: 

Adresse des n^chsten Zyklus I CONTROL-Signale 



30 



Somit ist ein vollwertiger Sequenzer definiert, der den Grundprinzipien der 
Mealy-Moore Sequenzem entspricht. 



Die Zustandssignale und/oder Control- Signal e kOnnen nunmehr ggf . zu Bttndeln 
zusainmengefaSt derart gruppiert werden, dass je eine Gruppe bestirnmten 
Sendem/Einpfangern zur Verftlgung steht, z.B. eine Gruppe ftlr 0101-inteme 
PAEs und eine Gruppe fUr exteme Baugruppen \md eine Gruppe zur 
35 Konfigurationseinheit. 



Mit anderen Worten werden sciiatliche SprUnge durch die Angabe der "Adresse des 
n£lchsten Zyklus" realisiert. Bedingungen werden durch die Ziistandsslgnale 
realisiert. 

Das dabei auftretende Problem ist, wie sog. don^t cares, also bestimmte 
Zustandssignale, deren Wert zu einem Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fttr saiutliche mOglichen Werte 
dieselben Daten festzulegen. 
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Bel spiel : 



Innerhalb einer f olgenderxnassen aufgebauten Adresse 



10 



Adresse des Zustandssigxxale 
aktuellen Zyklus 

soli die "Adresse des aktuellen Zyklus" (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCIjE60 sein. Bs sind 4 Zustandssignale (ZS0..3} vorgesehen, von 
denen innerhalb des beispielhaf te Zyklus' 2 (ZS3 und ZSl) iie nach Wert zu 
anderen Sprungzielen ftihren, also beispielhaft nach CYCLEIO, CYCLE?, CYCLE89, 
CYCLES 6, 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Da ten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLE60 


0 


? 


0 


? 


CYCLElO 


CYCLE60 


0 




1 


? 


CYCLE? 


CYCLES 0 


1 


? 


0 


? 


CYCLEB9 


CYCLE60 


1 


? 


1 


? 


CYCLE56 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einflufi auf die Zuordnung der Adresse zu den Daten hat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


ZSO 




CYCLES 0 


0 


0 


0 


0 


CYCLElO 


CYCLES 0 


0 


0 


0 


1 


CYCLElO 


CYCLES 0 


0 


0 


1 


0 


CYCLE? 


CYCLES 0 


0 


0 


1 


1 


CYCLE? 


CYCLES 0 


1 


0 


0 


0 


CYCLES 9 


CYCLES 0 


1 


0 


0 


1 


CYCLES 9 


CYCLES 0 


1 


0 


1 


0 


CYCLES S 


CYCLES 0 


1 


0 


1 


1 


CYCLES 6 


CYCLES 0 


0 


1 


0 


0 


CYCLElO 


CYCLE60 


0 


1 


0 


1 


CYCLElO 


CYCLES 0 


0 


1 


1 


0 


CYCLE? 


CYCLES 0 


0 


1 


1 


1 


CYCLE? 


CYCLES 0 


1 


1 


0 


0 


CYCLE89 


CYCLES 0 


1 


1 


0 


1 


CYCLES 9 


CYCLES 0 


1 


1 


1 


0 


CYCLES 6 


CYCLES 0 


1 


1 


1 


1 


CYCLE56 



15 

jeder Zielzyklus ist nunmehr 4-fach gespeichert/ entsprechend alien binaren 
Roxnbinationsm&glichkeiten der don't care. 



Eine weitere optionale, aber sinnvolle und daher bevorzugte 

20 Auscrestaltungsmaglichkeit des Seguenzers sieht einen zusdtzlichen Teilbereich 
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der Aus gangs da ten fUr eine Selektor- und/oder Vergleichsmaske ftlr die 
Zustandssignale vor. Bei der Verwendung als Selektor kdnnen z.B. durch die 
Ansteuenmg von X^Ultiplexem durch die Selektormaske eine Teilxnenge von 
Zustandssignalen aus mehreren mSglichen ausgewahlt werden. Die zusStzliche 
5 optionale Vergleichsmaske keum als Vergleichsoperator ftir einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don^t care Signalen dienen, z.B. Uber eine norxnale Maskenoperation durch 
Verundung nach dem Stand der Technik (siehe PACTlO) . 

10 

Der Aufbau der Ausgabedaten ist dann wie folgt: 



Daten: 



Adresse des nSchsten 


CONTROIi-Signale 


Selektor /Vergl eichsznaske 


Zyklus 







15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Seguenzerspeicher verwendet wird, wird 
in mehrere Teiladressen beliebiger und insbesondere zndglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 ftir eine erste 
20 Teiladresse (NBXT_CYCI*E) , Bit 4.. 7 fiir eine zweite Teiladresse (SECL.IN) \md 
Bit 8.. 12 ftlr eine dritte Teiladresse (CTRL_IN) . 

Der Datenausgang einer RAU-PAE wird in mehrere Telldaten beliebiger und 
insbesondere mdglicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fOr die ersten Teildaten (CYLCE) , Bit 4.. 7 ftir die 
25 zweiten Teildaten (SEQL.OUT) und Bit 8.. 12 ftir die dritten Teildaten 
{CTRLL.OUT) . 

Zur Auf teilung der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAH- PAE erfolgen, 

Der RAM-PAE kfinnen datenverarbeitende PAEs zugeordnet werden, wie z. B. AL0- 
PAEs. 

35 Die Festlegiing des n^chsten Zyklusses innerhalb eines Seguenzerdurchlaufs 
er folgt durch die Rtickkopplung von NEXT^CYCLE auf CYCLE, 

In einer erweiterten Ausftihorungsvariante k<5nnen zuscltzliche 
datenverarbeitende PAEs zur Berechnung von CYCIiE in AbhSngigkeit von 
40 NEXT_CYCLE innerhalb der Rtickkopplung vorgesehen sein. Diese PAEs k5nnen auf 
beliebige, insbesondere auch zusS.tzliche Signale, Daten oder Zust^de 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagieren. Desweiteren 
kC)nnen diese PAEs zusatzliche Signale oder Daten erzeugen. 

43 



wo 03/036507 



PCT/EP02/10572 



Zur Realisierung eines erwe iter ten Sequenzers kOnnen weitere PAEs auigekoppelt 
sein, die in einer mSglichen Ausgestaltung auch in ihrer Funktion und/oder 
Vemetzung vom Seguenzer beeinfluSt warden kfinnen. Dazu kann der Sequenzer 
Daten in die Konf igiirationsregister der entsprechenden PAEs -Obertragen. Ein 
5 Zugrif f auf die Konfigxxrationsregister kann beispielsweise dxirch die in DE 
197 04 728.9 beschriebene Architektur erfolgen {vgl. DE 197 04 728.9, Fig. 
4) . Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen Anschl\il5 an weitere PAEs, insbesondere datenvereirbeitende (ALU- PAEs) 
und/oder Speicher-PAEs (RAM- PAEs) und/oder periphere AnschlUsse (lO-PAEs) . 
10 Diese PAEs kOnnen durch die durch SECL-OUT darges tell ten Control -Signals 
angesteuert werden und kfinnen bedarfsweise durch die an SEQ_IN geleiteten 
Zustandssignale Ablauf speicher des Sequenzers ansteuem. 

15 Weitere mOglicherweise auch unabhSngige PAEs oder Einheiten, insbesondere 

auch exteme /periphere Einheiten und/oder Qbergeordnete CTs kOnnen durch den 
Sequenzerspeicher entsprechend SEC2.IN/0UT angesteuert werden (CTRL_OUT) oder 
diesen ansteuem (CTRL_XN) . 

20 

zur korrekten taktgesteuerten Ablauf steuenmg des Sequenzers sind in 
Rttckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kaim durch eine Obergeordnete Konf igurationseinheit kon£iguriert 
25 werden, insbesondere kfinnen die Sequenzer fxinktionen durch den Xnhalt der RAM- 
PAK konfiguriert und festgelegt werden. 

Es wurde als vorteilhaf t erkannt und wird fUr sich als patentfahig gehalten, 
dass mit einem Speicher ein einfacher Sequenzer ohne groSen zus&tzlichen 

30 Hcordwareaufwand realisiert wird. Dies ist besonders leicht dadurch si&glich, 
dass zun£Lchst der Xnhalt einer Speicher zelle dahingehend ausgewertet wird, an 
welcher Stelle als nSchstes ein Lesezugriff erfolgen soil. Wenn dort wieder 
angegeben ist, wo als n&chstes ein Zugrif f erfolgt, ist ein autoxnatenartiges 
Durchlaufen realisierbar. Zugleich wird aber gexn£l& der hier als vorteilhaf t 

35 erkannten Ausgestaltung nicht einfach eine weitere Adresse fOr den nachsten 
Zugrif f ermittelt, sondern parallel dazu angegeben, was dabei zu tun ist; mit 
anderen Worten werden an der Speicher adresse auch Daten oder Befehle 
mi tcJagespei chert. Dies keuin dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fUr den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

weiteres mOglich, wenn die Breite der gespeicherten Daten aufgeteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
mCglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann kOnnen weitere 

45 Bits hinzugeftlgt werden, hier vier, etwa durch Auswertung von Flags, 

Triggern, ZustSnden, Oberiaufen etc. Dies hat den Vorteil^ dass an die 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der bier 
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Sbitigen ausgelesenen Adresse luid der hier 4bit auswertegenerierten 
Information, unterschiedliche Anweieungen gesetzt warden kdnnen. Es sei 
darauf hingewlesen, dass entweder alle Trigger und die erforderliche Reaktion 
hierauf von vomeherein festlegbar sind oder dass altemativ auch zumindest 
5 Teile der Reaktionen au£ einzelne oder alle Trigger w^hrend der AusftOunxtig 
einer Konfiguration variiert und/oder festgelegt werden kttnnen. Hierzu kann 
eine RUckkopplung au£ eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abh&figig von den ausgewerteten Infonnationen bedingte 
10 Sprtinge etc. zu generieren. Sind dabei von einer Reihe per- se auswertbarer 
In forma tionen nur wenige interessant, werden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits ben6tigt, so kann die jewel Is in einer 
entsprechenden Speichers telle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die sich niir urn nicht inter ess ierende Bits in ihrer 
15 Adresse unterscheiden . 

i 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines er f indungsgemaSen Seguenzers 
basierend auf einer RAM-PAE. Ein Teil (1505) des Datenausgangs (1502) eines 
Speichers (1501) ist Uber ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers zurUckgekoppelt . Der Adresseingang (1504) 
entspricht somit CYCLE und 1505 einem Teil, bevorzugt dem HSherwertigen, von 
NEXT^CYCLE. 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 

25 Maskeneinheit (1509, 1510) gefOhrt werden, in welcher die vom Bussystem 0105 
als Daten und/oder Trigger eingehenden SEQl_IN (1511) bzw. CTRLJN (1512) 
Da ten verarbeitet werden. 

CTRL_IN und SEQUIN und/oder deren in der Selektor-Maskeneinheit verarbeitete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 1505 den 
hOherwertigen Adressteil imd CTRL_IN/ SEQUIN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SECLOUT- (1506) 
und CTRL_OXJT (1507) Teil aufgetrennt werden xind tlber die Ausgabebaugruppen 
35 0803a, b als Daten und/oder Trigger auf das Bussystem 0105 gefilhrt. 

Verschiedene Konfigurationsregistermodelle zur Festlegung der Konfiguration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrieben, in PACT04 ist ein FIFO-Modell 
40 beschrieben, das ebenfalls sequentiell abgearbeitet \md Oberlappend 

konfiguriert werden kann, in PACT08 ist ein selektives Modell beschrieben, 
bei welchem abhSngig von der Datenverarbeitung bestimmte 

Konf igurationsregister und damit die in ihnen gespeicherte Funktion und/oder 
Vemetzung ausgewShlt werden. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Modell beschrieben, das sich besonders ftlr die Vorabkonfiguration und 
tlberlappende Konfiguration eignet. 
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Als besonders leistungsfahig und Kos ten/ Performance effizient vmrde eine 
Mischung aus diesen Modellen erkannt. 

Das FIFO-Modell nach DE 100 28 397.7 eignet sich besonders, um eine 
5 beliebige Anzahl von Konfigurationsregistem von PAEs vorzuladen, da die 
Funktion des verwendeten FIFOs eine variable Konfigurationsiange effizient 
ermOglicht. Hierzu wird jeder PAE ein lokaler PIFO-Speicher zugeordnet, der 
die Konfigurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 

Modelles kann der Anfang vnd das Ende einer bestimmten Konfigiiration und der 
dazugehdrenden einzelnen Konfigurationseintrage festgestellt werden. Nunmehr 
kOnnen mehrere Konfigxirationen zugleich in dem FIPO-Modell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des Anfangs oder Endes von 

Konfigurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
herausgestell t : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicher zelle : 
20 Jedem Konfigurationseintrag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf iguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0. .15 


Bit 16 


Bit 17 


Konf igurationswort 


O=don' t 
care 

l=Beginn 


O=don' t 

care 
l=Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konfigurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0..15 


Bit 16 




Konf igurationswort 


O=don't 

care 

l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden: 
30 Bestimmte Bitkoxnbinationen innerhalb des Konf igurationswortes werden als 

Befehle dekodiert und erkannt: 

Beispielsweise kdnnten die folgenden Befehle implementiert sein: 
BEGIN : Beginn einer Konf iguration 
END : Ende einer Konf iguration 
35 Dieses Verfahren ist erheblich flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen Unterscheidung von Befehlen und Konf iguratxonen kaiin Shnlich 
den CycleBits ein Bit vorgesehen sein, das durch seinen Wert die Semantik der 
Konfigurationswortes bestimmb, beispielsweise wie folgt: 



Bit 0..15 


Bit 16 


Daten 


O=lnterpretation der Daten als 




Konf igur a t ionswor t 




l=Interpretation der Daten als 




Befehl 



S Eine Konfiguration wird je Aufruf von ihrem Anfang bis zu ihrem Ende in die 
Konfiguratlonsregister einer PAE Obertragen. 

Durch eine optionale zusStzliche Obersetzungs- und Zuweisungsvorrichtung 
k&nnen Zust&ide (z.B. ZustSnde der eigenen ALU und/oder ein oder roehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise einderer PAEs) auf bestiitimte 
Konf iguratxonen innerhalb des FIFO-Modells libersetzt werden, Beispielsweise 
kann ein eintref fender Rekonfigxirations trigger auf eine bestixnmte 
Konfiguration innerhalb des FIFO-Modells zeigen, die durch das Auftreten des 
Rekonf igur at ions trigger dann konfiguriert wird. 

15 

Als t)bersetzungs- und Zuweisungsvorrichtung kdnnen beispielsweise 
algebraische Berechnungen und/oder logische VerknUpfungen und/oder bevorzugt 
Obersetzungsspeicher (Lookup-Tabellen) zum Einsatz kommen. 

20 Wenn verschiedene Konfigurationen in einer Oder fUr eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einfache Weise dadurch zu verwalten, 
dass die LSngen der jeweiligen abgespeicherten Konfigurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konfigurationen unterschiedliche 

25 Ltogen ha3Den, etwa weil bei bestimxnten Konf ig\u:ationen Busse imd/oder 

Register, wie Vorw&rts- und Rtlckwartsregister konfiguriert werden mQssen und 
bei andere nur neue Punktionen der ALU einer PAE einzustellen sind, oder weil 
gleichzeitig Konfigxirationsinformation fUr zellexterne Einheiten mitverwaltet 
wird. 

30 

Es ist damit also mOglich, einen Quasi -Fifocharakter zu implementieren. Dann 
sollten Hittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konfigurationsiangen, sowie dafar, bei OberflUssigwerden bestimmter 
Konfigurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
m5glich. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konf ig\irationen zu 
verwalten bzw. wiederum einen Sequenzer zu ixnplementieren. Wiederum kann so 
40 auf die Konfigurationen reaglert werden, dass sich Sprtinge etc realisieren 
lassen. Es sei darauf hingewiesen, dass oben bereits erwHhnt wurde, dass zur 
Realisierung von Sequenzem zwischen ALU-PAKs xmd/oder anderen 
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datenverarbeitenden Zellen mit jeweils gegebenenfalls erweiterter 
Funktionalitat und Speicherzellen Steuer (Coxranand-)Leitungen vorgesehen werden 
k6xmen. Es sei erwSihnt, dass derartige Iieitiingen mit zugeordeten Steuerungen 
auch innerhalb einer einzelnen und ft&r sich autark seqexuizerf^lgen PAE 
5 vorgesehen sein k6imen. 



Eine besonders bevorzugte Vsiriante ist in Figur 14 dargestellt und arbeiteb 
wie folgt: 

10 Eine Kette von Addierem wird derart miteinander verbunden, dass das Ergebnis 
(SUMME) eines vorherigen Addierers (p) an einen nachfolgenden Addierer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart imterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (MUll) weitergeleitet wird. 
Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SUMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konf igurations-FIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition ISfit sich nun 
berechnen, indem ScLmtliche relative Startpositionen der sich unterhalb izn 

20 FIFO befindenden Konfigurationen auf addiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Fig, Ersichtlich ist. 



Mit anderen Worten ist die relative Position als unterste Konfiguration im 
FIFO diejenige, deren Eintrag am N£lchsten z\uii Ergebnisausgang der 
25 Addiererkette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gemSfi ihrer Anordnung im FIFO, 



Die Kette wird cui der S telle durch einschleusen einer Null ans telle der SUMHB 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konfiguration erreicht ist. 

Das Ergebnis ist numnehr der Offset zwischen dem Lesepointer des FIFOs, der 
auf die imterste Konfiguration zeigt, und der Startposition der selektierten 
Konfiguration . 

Somit ist die Sprungadresse zur selektierten Konfiguration einfach diirch 
35 Addition von Zeiger und Offset berechenbar. 



Die Auswahl der selektierten Konfiguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kdnnen priori siert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden Ober eine Lookup-Tabelle tibersetzt und 
danach m£)glicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewShlt, z.B. tlber 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soil besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konf iguration. Dies ist insbesondere dcuin wichtig, wenn eine Wave- 
Rekonfiguration nach PACT08, PACT13, PACT17 durchgeftihrt werden soil, bei 
welcher bevorzugt ein mit den Daten tibertragener Trigger-Vektor die nftchste 
Konf iguration selektiert. 

5 

Nach Oder wShrend der Konf iguration ktinnen Konf igurationen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
tJbersetzungs- und Zuweisungsvorrichtung entsprechend angepasst. 

10 

Weiterhin kann das FIFO-Model 1 um das Sequenzer-Verfahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwShnt zu 
sein, deren parallels) oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise SprUnge (GOTO), sowie zustandsabhangige 
15 und bedingte Spriinge (WAIT-GOTO, IF-GOTO) eingefOhrt. Sprtlnge kttnnen durch 
besondere CycleBits represent iert werden, oder bevorzugt als Befehle 
inqplementiert sein. 

Weiterhin kann ein Synchronisationsanzeigeverfahren verwendet werden, das 
20 anzeigt, wann eine bestixnmte Konf iguration bzw. ein bestixnmter Zyldus des 
Sequenzers beendet ist. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konf igurat ions eintr&gen bestehen. Zur Kennzeichnung kann beispielsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei 'run' 
zusaiomengeh&rende Konfigurationseintrdge eines Zyklus kennzeichnet xind 'stop' 
25 den ersten Eintrag eines nachf olgenden Zyklus; altemativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits m5glich, die zwar eine 
etwas andere Semcuitik aufweisen, sich aber ansonst gleich verbal ten. 

Altemativ oder zuscltzlich zu diesen Verfahren k&nnen auch die ebenfalls aus 
30 den frtUieren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden . 

Durch *stop' Oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. eine Konf iguration ist kon^lett, kann ausgeftUirt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konf iguration wird der nclchste 
Zyklus ausgefUhrt. 

Die Beendigung kann entsprechend seguentieller Prozessoren durch einen Takt 
(Instruktionssequenzing) definiert sein, und/oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationsseguenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 'stop* 
45 tibersprungen werden und die nachf olgenden Konf igurationen konfiguriert 

werden. Altemativ oder zusStzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nicht nur die lokal zugeordnete PAE ansteuem, sondern 
auch weitere, insbesondere umliegende oder zur selben Konf iguration gehOrende 
PAEs. 

5 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

AusfUhrungsbeispiele : 
10 A) Ein eintref fender Trigger wird ttber eine Obersetzungs- vind 

Zuweisungsvorrichtxing auf eine im FIFO liegende Konf iguration (Kl) tibersetzt. 

Die Konf iguration (Kl) wird daraufhin in die PAE konfiguriert, Als Ende- 

Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 

run/ stop-Flag dienen. 
15 Ein nachfolgend eintref fender Trigger wird tlber eine tJbersetzungs- und 

Zuweisungsvorrichtung auf eine andere im FIFO liegende Konf iguration (K2) 

tibersetzt. Diese Konf iguration (K2) wird daraufhin in die PAE konf iguriert . 

Kl und/oder K2 k5nnen nach erfolgter Konfiguration in die PAE aus dem FIFO 

geie^scht werden. 

20 

B) Ein eintref fender Trigger wird tiber eine Obersetzxings- und 
Zuweisungsvorrichtiing auf eine im FIFO liegende Konfiguration {K3) tibersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konf iguriert und ausgeftlhrt. Als Ende-Kennung 

25 kann beispielsweise ein WAIT-Befehl oder das r\m/ stop- Flag dienen. 

Ein nachfolgend eintref fender Trigger, der dsis AusfUhrungsende des Zyklus 
anzeigt, bewirkt die Konfiguration \ind das Ausftlhren von Cy2. Cy2 endet mit 
zwei WAIT-GOTO-Befehlen (WAIT-GOTO (Trgl, Cy3a) / WAIT-GOTO (Trg2, Cy3b) ) 
(vgl. PACT04>, dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 

30 AusfUhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nSchsten Zyklus Cy3a konfiguriert \ind ausgeftlhrt bzw. bei Trg2 
entsprechend Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das AusfUhrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konfiguration entsprechend konfiguriert und ausgeftUirt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintref fen des Trigger, 
der das Ausftlhrungsende des Zyklus anzeigt, der emeute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausftlhren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaf t, aber nicht 
zwingend ist. 

45 Durch Eintreffen eines Triggers (Trg-x) kann die Schleife terminiert werden. 
Existiert ein Eintrag ftir Trg-x in der t)bersetzungs- und 

Zuweistingsvorrichtxing kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der t^feersetzungs- und Zuweisiingsvorrichtung referenzierte 
Konfiguration (KX) ausgefUhrt werden. 

Existiert kein Eintrag, kann diirch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schleife zu bestixnmte vorgegebenen Ausftlhrxmgszeitpimkten termini ert werden. 

Flgur 13 zeigt beispielhaft einen Aufbau eines Konfigurationsbusses ztir 
Konf igiiration von PABs (1001) durch eine Konf igurationseinheit (0106) . Die 
Konf igurationseinheit sendet Konf igurationsdaten Uber ein Bussystem 1301 und 

10 ggf . Uber mehrere Registerstufen (1303, 1304) zur Verbessening des 

Frequenzverhal tens und tiber den Konfigurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofem sie 
eelektiert wurde, auf die Datentibertragung des Busses. PAEs kOnnen ihrerseits 
Daten iXber 0404 Uber die Register-Multiplexer-Stuf en 1304 auf das Bussystem 

15 aufschalten und die Konf igurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch t)bertrag\ing der Adresse der Empf angseinheit. 
Die RUckQbertragung der Daten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls durch Hegisterstuf en hindurch (1305) , bis ztun Dateneingangsbus der 
Konfigurationseinheit (1302) . 

20 Die Funktionsweise des Konfigurationsbusses ist ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of fenbarungszwecken vollumfSnglich 
eingegliedert sind. 

Fig\ir 14 zeigt den Aufbau eines erf indungsgemSlfien FIFO-Modells zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befclhigung zur DurchftLhrung von Sprttngen das hier pr^eentierte 
Fifo-Modell von reinen Fifes aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen, sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren l£U&t. Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anmeldungen beschriebenen» rekonf iguierbaren Zellen (PAEs) und In 
Figur 4 als Einheit 0406 dargestellt. 

Ein Speicher 1401 enthcLlt die Konf igurationsdaten filr die zugeordnete PAE. 
1402 ist der Konf igurationsdatenausgang zu den Konf igurationsregi stem der 

35 PAE (0405). Ober 1403, d.h. den Bus 0404, schreibt die Konfigurationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang um den Wert 1 
vertodert wird, je nach Arbeitsweise des FIFOs inkreinentell oder 
dekrementell . Ein Startadress-Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu ttbertragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder Datentlbertragung aus 
dem Speicher an die PAE um den Wert 1 verSndert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die Datentibertragung findet so lange 
45 statt, bis das Ende der Konf igviration von einer 

Konf igurat ions endeerkennungseinheit (1409) erkannt wird, bei spiel sweise 
anhand eines CycleBits oder Befehls (WAIT, END) . 
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Der realisierte FIFO entspricht nicht den normal en FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufweisen. Die Modifikation ermOglicht das 
Lesen beliebiger Konf ig\arationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch benStigte Konf igurationsdaten 
5 tlberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Startadress-Pointers 1404 mit dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igurat ions einheit zurtickgewiesen, dies kann bevorzugt durch das aus 
PACTIO bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konfigurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicher inhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
enthait 5 Konf igurat ionen (C0..C4). 1404 zeigt als Startpointer auf die erste 
15 Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konf iguration C3 . Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konf igizration CO plus der LSnge der Konfiguration CI plus 
der IiSnge der Konfiguration C2. 

Eingehende Trigger (1431) werden tiber eine in Pigur 14a dargestellte 
tJbersetzungs- und Zuweismgseinrichtung (1432) auf Selekt-Signale (SCO..n, 
1433) tlbersetzt, die die Adressierving der Konf igixrationsdaten im Speicher 
steuesm, Diese Obersetzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vomehnen, ist aber bevorzugt wShrend der Abarbeitung einer 
Konfiguration veranderlich, wozu geeignete Rtlckkopplvingen, Signalleitungen 
etc. vorzusehen sind. Besonders wenn die t)bersetzungs~ und 
Zuweisungseinrichtung veranderlich ist^ wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wShrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind entsprechende 
Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
instaesondere programmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere programmgesteuerte VerSnderung ist auch ftlr die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel mttglich. Die diese 
Aktualisierung und/oder neue Verbal tenswei sen ausltisenden Befehle werden 
bevorzugt in der Speichereinheit 1401 hierfOr abgelegt. 

Je ein Register (1411), ein Addierer (1412) imd ein Nullgenerator (1413), 
hier beispielhaft realisiert durch eine bitweise Und-Funktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnxing , Je ein Glied verwaltet den 
40 Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konfigurationen im Speicher 1401. Mit anderen Worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
torn auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Lange der 
45 Konfiguration CI auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, urn auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die LAnge der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert warden muss, \m ant die 
Konfiguration C3 zu zeigen. Und so weiter. 

Es wird anhand der AusfOhrimg ersichtlich, dass eine Kette von Additionen 
entsteht, deren Gliederanzahl der Position der Konfiguration im Speicher 

5 entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 

Ober den Addierer wir jeweils der im Register gespeicherte Wert, also die 
Lflnge der jeweiligen Konfiguration, zu dem Ergebnis des vorherigen Gliedes 
dazuaddiert. Der Wert am Eingang der bitweisen Und-Funktion wird mit alien 
Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 

10 die Und-F\mktion eine Bin^re 0 am Ausgang, Tim die Addiererkette bei der 
auszuwShlenden Konfiguration abzubrechen, ansonsten den Wert des 
Addierersausgangs . 

Mit anderen Worten ist in die Register (1411) die OrOfie der Konf igurationen 
15 in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null -Generator en geftUirt, dass die Konf igur at ions -OraiSen bis 
2ur Startadresse der durch die Trigger (1431) referenzierten Konfiguration 
auf addiert werden. 

20 Somit addiert die Kette alle IiSngen von Konfigurationen, die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schaltung ist besonders leistungsfahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes errofiglicht. 

In einer zweiten optionalen Kette (1421) kOnnen in Registem (1422) Befehle 
an die Konfigurationseinheit und/oder die PAE und/oder den 

30 Konf igurationsstack gespeichert werden. Eine Null funkt ion (1423), hier 

ebenfalls beispielhaft entsprechend der NUllfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, sofem das Selekt-Signal nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewShlt wvirde, ansonsten den Registerinhalt 
(1422), also den Befehl, tJber eine Oder-Kette (1424) werden alle Null- 

35 Funktionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum LQschen von Eintragen im Speicher (1401) dienen, 
d.h einer der mOglichen Befehle Jcann sein, dass bestimmte gespeicherte 

40 Konf igurationen gelOscht werden sollen bzw. zum Oberschreiben frelgegeben. 
Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum tJberschreiben freigibt. Dies ist insofem bevorzugt, als die so zu 
Oberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daher typisch tiberschrieben werden kOnnen, wahrend die jtlngeren 

Konf igurationen, die oftmals noch ben^tigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt implementierter 
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Befehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Erfordemis, eine bestimmte neue Konfiguration zu 
bendtigen, mit einer zumindest nicht geringen Wahrscheinllchkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine zentrale 
5 Konf igurationsverwaltungseinheit oder dergl. abgegeben werden; die 
Direktladung ist gleichfalls mfiglich, etwa bei Zuordnung von I/O- 
Hdglichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konfigurationsanforderungsbefehl als auch der Flush- bzw. 
Altkonfigurationspreisgabebefehl siraultan ausftihrbar und/oder speicherbar 
10 Bind. Es sei erweUmt, dass derartige Befehle wie Flush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind und dafOr nicht zwingend eine dedizierte Einheit wie 1421 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwaremllfiig bevorzugt sein. 

15 

Weiterhin kann der Befehl tiber das Bussystem nach Figur 13 an die 
Konfigurationseinheit gesendet werden (1426). Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konfiguration auslOsen und/oder das Vorladen 
einer Konfiguration bewirken. 

20 

FLUSH, also das LOschen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fUr die AusfUhrung, andererseits weist er das Problem auf , dass sich bei 
dessen Ausflihrung s&ntliche Adressen und Referenzen ver&idem. 

25 Der FIFO wird "gef lushed" , indem der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Begixm einer gespeicherten Konfiguration gesetzt, wobei der Begixm 
durch die vorab beschriebene Berechnung mittels des Offsets bestiinmt wird. 
Altemativ oder zusdtzlich kann der Zeiger auch auf einen bestiznmten anderen 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin mQssen die beiden Ketten 1414 und 1421 "geflushed" werden, damit 
die Adressberechnung der geSLnderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils diirch (in Fig\ir 14 nicht 
eingezeichnete) Multiplexer (1451), durch die die Registerdaten derart 

35 vorwartstilaertragen werden, dass die nunmehr leeren ( "gef lushten" ) Glieder der 
Kette mit den Daten der nachfolgenden Glieder tiberschrieben werden, vind zwar 
derart, dass a) die Reihenfolge der Daten in der Kette iinverandert bleibt und 
b) das erste Glied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne LUcke in die Glieder nachfolgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass Ober die Ilultiplexer 1451 auch Daten betreffend die Konf igurationsgr(5fie 
von aufien an die entsprechenden Stellen {Size of Config l..n) geschrieben 
werden kOnnen. Es ist dabei abzusch&tzen, aber aus Grttnden der 
Zeichnungstlberslchtlichkeit nicht dargestellt, dass jede Stelle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestimmt. 
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Durch die Verschiebung innerhalb der Ketten sind nxinmehr die Selekt- Signals 
(SCO..n) an die neue Lage der Daten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of fsetberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur VerfUgung. Beispielsweise 
5 k6nnen 

a) Signale nach 1432 in 1434 binSr kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Plush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74IiS139) um die S el ekt- Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels einer Lookup -Tabe lie auf die Selekt- 
Signale 1433 tibersetzt werden. Dazu ist die Lookup -Tabelle der durch Flush 
ver&iderten Positionslage in den Ketten anzupassen. 

Ein besonders bevorzugtes Verfahren fOr die ttoersetzung der Signale soli 
detailliert beschrieben werden tmd entspricht der in 1434 eingezeichneten 
Vorrichtung : 

Ein erstes Schieberegister (1435) enthSlt als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 
1421. Dies geschieht f olgendermaSen : Nach einem Reset wird das 
niederwertigste Bit im Schieberegister auf 1 gesetzt (dargestellt durch einen 
geftillten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten referenziert. Mit jedeia Schreibzugrif f auf die Ketten, also mit 
jedem neuen speichem (FILL) einer Konf iguration nach 1401 schiebt das 
Schieberegister das gesetzte Bit (PBIT) um eine Position in Richtung des 
httchstwertigen Bits \md referenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hachstwertige Bit referenziert somit auf das hOchste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 
(PBIT) vim genau so viele Positionen wie Glieder in den Ketten geldscht warden 
in Richtung des niederwertigen Bits. 

Die tjbersetzungs- \md Zuweisungseinrichtung (1432) tibersetzt bei der PAE vom 
Bussystem (0105a, Fig. 4) eingehende Trigger derart, dass je Trigger ein 
35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben Gr6Be wie 1435 zugeordnet. £s sind also 
eine Vielzahl von Schiebergistem 1436 (vorliegend dargestellt X436a. . .1436c) 
vorhanden, wobei der en Anzahl der Anzahl der maximal zul&ssigen 
unterschiedlichen Triggersignale entspricht und deren LSnge d.h. Bitbreite 
40 der Anzahl der maximal zul^ssigen Konfigurationen entspricht, also der tozahl 
der Kettenglieder entspricht. Beim neuen Speichem einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete. Trigger 
zeigt; dargestellt durch einen Kreis. 
45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

tibersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert liefem. Die Signale 1437 werden jeweils an NUllgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und-Punktion gefOhrt. Alle Nullgeneratoren 
deren Eingangs signal von 1437 einen 0-Wert aufwelst, liefem einen Nullvektor 
am Ausgang. Der NUllgenerator, dessen Eingangs signal von 1437 einen 1-Wert 
aufweist, tlbertragt den Inhalt des Schieberegisters 1436. Die Ausgtoge aller 
5 Nullgeneratoren werden miteinander verodert (1439), sodass die Selekt-Signale 
SCO..n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger tiber die 
Nullfunktionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einein Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeicherten Wert um genau so viele Positionen, wie Glieder in den 
Ketten gelOscht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT tiber das 
niederwertigste' Bit hinausgeschoben wurde, bedeutet dies, dass die voxntals 
referenzierte Konf iguration geldscht wurde. 

Liefert 1434 ftir einen eingetrof fenen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konfigurationsaufforderung an die Konfigurationseinheit zu 
senden, \m die fehlende Konf iguration zu laden oder ggf . auch ein 
Fehlerstatus an die Konfigurationseinheit zu melden. 

Die tJbersetzimg der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
kSnnen, beispielsweise: 

1. Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl . PACTIO) 

3. Lookup-Tabelle (vgl. PACTIO) 

30 Prinzipiell kann die Obersetzung dem in PACTIO beschriebenen verfahren 

entsprechen (Round-Robin-Arbiter, LtTTl) . 

Fehlt eine tJbersetzungsvorschrif t, beispielsweise bei der Anwendung von 
Loolcup-Tabellen, ist eine Konfigurationsaufforderung an die 
Konfigurationseinheit zu senden, um die fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konfigurationseinheit zu melden. 

Eine weitere wesentliche Fimktion des Konf igurationss tacks nach Figur 14 ist 
das Seguenzen tiber Konf igurationen, was bedingte und \mbedingte SprHnge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprtaigbefehle in 
Konfigurationsworten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin ist als Konstante ein Vergleichswert (1469) mit den eintref f enden 
Triggern oder den Statusflags der PAE, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags full, enqpty, etc., 
angegeben, in AbhSngigkeit dessen bedingte SprOnge durchgefiihrt werden. Diese 
5 wird an eine Vergleichseinheit 1464 Obermittelt, die den Wert mit den Flags 
(1465) und/oder Triggern, die von dem Augang Obersetzungs- imd 
Zuweisungseinrichtung (1437) \md/oder direkt von dem BusBystem 0105 stanonen, 
verglichen. 

Bine Steuereixiheit (1466) generiert in Abh^gigkeit des Befehles (bedingter 
Oder unbedingter Sprung = "Type") und des Vergleichsergebnisses die 
Ansteuerung fUr den Lesezeiger (1405) wie folgt: 

Onbedingter SJpnmg: Generiere "Set", um neue Adresse nach 1405 zu laden; 
Bedingter Sprung, Vergleidh erfttllt; Generiere "Set"* um neue Adresse nach 

1405 zu laden; 

Bedingter Sprung, Vergleich nicht erfiillt: Generiere "Count", um Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. t)ber einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konfigurationen (1461) ausw^lt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepointer 1405 geschrielden. 

Die Arbeitsweise des Konf igurationstacks macht die Verwendtuig von 
Konfigurationseinheiten (CT) wie aus PACTIO und PACT17 bekannt weitgehend 
oboslet, vielmehr ist eine verteilte, parallele CT durch die 
Konf igurationss tacks entstanden. 

Zwei Aufgaben der CT kOnnen dabei jedoch bei einer solchen Einheit 
verbleiben: 

1. Das Iiaden der Konfigurationen aus einem Speicher, der chipintem oder 
-extern ixnplementiert sein kann, als flflchtiger oder nicht flUchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 
35 und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Kikrokontroller erfolgen, der Daten an die PAEs sendet und 
auf die zurttckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
FACTO 5 beschriebene Algorithmus eingesetzt werden. Das Leuien mufi nicht 
40 mehr zwingend aktiv geschehen, sondem es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konf igurationsanfordemingskommando 
das Hereinholen der neuen Konfigurationsdaten in die jeweilige PAE 
bzw. deren zugeordneten Ronfigurationsspeicher vereoilasst. Dies kann. 
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etwa bei den vorstehend diskutierten I/O-PAEs auch jene PAE selbst 
sein, die derzeit neue Konf igxirationsdaten ben6tigt. 

2. Die verbleibende Resteinheit kann verwendet werden, urn 

5 sicherzustellen, dass Rekon figurations trigger (WCT) in einer 

bestimmten Reihenfolge sortiert durch das Array laufen \ind/oder 
vorgeladene Konf igurationen in der erf order lichen Reihenfolge 
abgearbeitet warden und/oder noch nicht geladene, aber bendtigte 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 

10 Diese Rekonf igurationstriggerpriorisiemng kann dazu verwendet werden, 

zu Priorisieren, auf welchen Rekonf igorationscinf orderungstrigger 
zuerst reagiert werden soli. Dies stellt die konf liktfreie Abarbeitung 
unterschiedlicherf xnOglicher Konf igurationen sicher, indem lediglich 
festgelegt wird, welcher Trigger ztuiachst durch das Array l&uft. Wenn 

15 ein solcher Trigger eine bestimmte PAE betriff t, die auf diesen 

Trigger reagieren soil, wird sie sich dies merken, urn dann als 
n&chstes auf diesen Trigger reagieren zu kOnnen, sobald sie 
rekonf iguierbar ist. Es sei erwdhnt, dass bevorzugt die einzelne Zelle 
Oder ein Zellgebilde oder dergl. nicht nur jene Trigger vormerkt, die 

20 unmittelbar nachfolgend abzuarbeitende Konf igurationen betreffen, 

sondern dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kOnftig abzuarbeitenden Konf igurationen in ihrer Reihenfolge 
abgelegt werden kdnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erh^lt und behaitr 

25 die sie zukOnftig und/oder aktuell betrifft. Damit wird die Filmo- 

Funktion der frUheren CT tiberflUssig und dtirch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3. Sofem nur ein Rekonf igurationstrigger verwendet wird, sind keine 
30 besonderen Mafinahmen erforderlich. Wenn mehrere 

Rekonf igurationstrigger (WCT) auftreten kOnnen, mtissen diese ohne 
zeitliche t)berlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen/ urn Deadlocks zu verhindem. 

35 Die kann durch das in Figur 16 dargestellte Verfahren sichergestellt werden, 
bei welchen durch Routing-Mafinahmen ftir eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fttr 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfemungen der 1601 in der 

40 Matrix ftihren zu unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Sinsetzen von Pipelinestuf en 
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(1602) durch den, dem Coinpiler zugeordneten Router, erreicht (vgl. PACT13) . 
Die sich dadurch ergebenden Latenzen sind mit dl-d5 angegeben. Es ist 
ersichtlich, dafi in Richtiing des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise wdre 1605 nicht notwendig, da 
5 die Entfemung von 1606 von 1603 sehr gering ist. Da aber ftir 1607 und 1608 
je ein 1602 aufgrund der durch die ISngere Distanz entstehenden Laufzeit 
eingefUgt werden muS, wird 1605 zum Abgleich der Laufzeit notwendig. 
Die zentrale Instanz 1603 nixnmt von den PAEs eingehende 

Rekonfigurationstrigger (1609) auf und priorisiert diese, Mm sie dann jeweils 
10 einzeln und nacheinander als WCT an das Array aus PAEs zu senden. Mit 

anderen Worten sendet eine PAE, die einen Rekonfigurationstrigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondem ausschliefilich an die 
zentrale Instanz 1603. 

15 Die zentrale Instanz speichert eingehende Trigger \md priorisiert diese. Dazu 
kann bevorzugt das aus PACTIO bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Pigur 8 PACTIO ausfiihrlich beschrieben ist. 
samtliche erwShnten PACT-Schutzrechte sind zu Of fenbarungszwecken 
vollumf&iglich eingegliedert . 
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Titel: 
5 Patentansprtlche 

1. Zellementefeld zur Datenverarbeitxang mit Funktionszellen zur Ausftlhrung 
algebraischer und/oder logischer Funktionen und Speicherzellen, um 
Information zu enpfangen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzelchnet , da& von den Funktionszellen eine Steuerverbindung zu den 

Speicherzellen geftUirt ist. 

2. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzcihl in Funk ti on und/oder Verne tzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Funktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einera der vorhergehenden Ansprtlche, dadurch 
gekennzeichnet, daS die Fmktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daiS die aritbmetischen Logikeinheiten als erweiterte ALUs gebildet sind, 

25 5. Zellementefeld nach einem der vorhergehenden AnsprQche, dadurch 

gekennzeichnet, da& die Speicherzellen zur flUchtigen und/oder nicht 
flttchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden AnsprUche/ dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Daten und/oder von zu verarbeitenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, dafi die 
35 Speicherzellen dazu ausgebildet sind, abgespeicherte Informationen auf 

Ansteuerung der sie steuemden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle ffUirenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden AnsprUche, worin ziariindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Inf ormationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

45 gekennzeichnet, da£ die Speicherzelle dazu angeordnet ist, Informationen 

von der sie steuemden Pimktionszelle, einer Eingabe-Ausgabe-Zelle 
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xind/oder einer sie nicht steuemden Zelle mit arithmetischer Logikeinheit 
zu empfangen. 



10. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadiirch 

5 gekennzeichnet, dafi der Functions zellen-Speicherzellen-Kombination 

zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, um Informationen an eine 
externe Einheit und/oder eine andere Funktionszelle, Punktionszellen- 
Speicherzellen-Kombination und/oder Speicherzelle zu senden und/oder von 
dieser zu empfangen. 

10 

11. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS das Ein-Ausgabe-Mittel gleichfalls zum Er^fang von Steuerbef ehlen 
aus der Funktionszelle ausgebildet ist. 



15 12, Zellementefeld nach einem der vorhergehenden Ansprllche, dadurch 

gekennzeichnet, daS die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alle der nachfolgenden Befehle zu tlbertragen und/oder 
die Speicherzelle bzw. Bingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
folgenden Befehle zu dekodieren: DATA WRITE/READ, ADRESSPOINTER 

20 WRITE/READ, PROGRAMMPOINTER WRITE/READ, PROQRAMMPOINTER INCREMENT, 

STACKPOINTER WRITE/READ, vorgenannte Befehle jeweils insbesondere ftlr 
intemen und/oder externen Zugriff , PUSH, POP, OPCODE, FETCH. 

13. Zellementefeld nach einem der vorhergehenden AnsprUche, dadurch 
25 gekennzeichnet, dafi die Funktionszelle als alleiniger Master auf die 

Steuerverbindung \ind/oder das als Steuerungsverbindxing dienende 
Bussegment zugreifen kann. 



14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
30 AnsprCLche, dadurch gekennzeichnet, daS die Funktionszelle zumindest 

einer von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet ist. 

15. Zellementefeld nach einem der vorhergehenden Ansprttche, dadurch 
gekennzeichnet, da£ die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw, Ein-Ausgabezelle aus einer oberen Reihe Daten 
en^fangen und in eine untere Reihe Oaten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle xind zumindest eine 
Speicher- und/oder Kin~Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren ziom Betrieb eines Zellelementefeldes, insbesondere 
multidimensional en Zellelementefeldes mit Funktionszellen zur AusffUirung 
algebraischer und/oder logischer Punktionen und 

Informationsbereitstellungszellen, insbesondere Speicherzellen und/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen 

und/oder Speichem derselben, dadurch gekennzeichnet, daS z\amindest eine 
der Funktionszellen Steuerbef ehle an zumindest eine 
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Informationsbereitstellungszelle ausgibt, dort im Ansprechen auf die 
Steuerbefehl information £tir die Funktionszelle verarbeitet wird und die 
Functions zelle dazu ausgebildet 1st, eine weitere Datenverarbeltimg im 
Ansprechen auf aus der Inf ojntiationsbereitstellungszelie bereitgestellte 
5 Information durchzufOhren, \m so sequenzerartig Da ten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, daS die Funktionszelle dazu ausgebildet ist, zumindest 

einige der Steuerbefehle 
10 OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 

DATA READ INTERN, 

DATA READ EXTERN, 
15 ADRESSPOINTER WRITE INTERN, 

ADRESSPOINTER WRITE EXTERN, 

ADRESSPOINTER READ INTERN, 

ADRESSPOINTER READ EXTERN, 

PROGRAMMPOINTER WRITE INTERN, 
20 PROGRAMMPOINTER WRITE EXTERN, 

PROGRAMMPOINTER READ INTERN, 

PROGRAMMPOINTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPOINTER INCREMENT 

30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbefehle wie erforderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensionalen 
35 Peld 

in Funktion und/oder Vemetzxing konf igurierbarer Zellelemente und 
diesen zugeordneten Konfigurationsvorhaltemitteln zum lokalen 

Konf igurat ions -Vorhal ten, 

dadurch g e k e n n z e i c hn e t , daS 
40 die Konf igurationsvorhaltemittel dazu ausgebildet sind, 

zumindest einen Teil der vorgehaltenen Konfigurationen 

nichtfltlchtig vorzuhalten. 



19. Datenverarbeitungsanordnimg mit einem multidimensionalen 
45 Feld 

in Funktion und/oder Vernetzimg konf igurierbarer Zellelemente xind 
diesen zugeordneten Konfigurationsvorhaltemitteln zum lokalen 
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Konf igvirat ions -Vorhal ten , 
dadurch g e k e n n z e i c h n e t , daS 
die Konfigiirationsvorhaltemittel dazu ausgebildet aind, 
alle vorgehaltenen Konf igurationen 
5 nichtfltichtig vorziahalten. 

20. Datenverarbeitungsanordnixng nach einem der vorhergehenden 
Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, da& die 
Funktion grobgranular konf igurierbar ist. 

10 

21. Datenverarbeit\ingsanordnung nach einem der vorhergehenden 
Datenverarbeitungsanordnungsansprache, dadurch gekennzeichnet, daS die 
Verne taung grobgranular konfigurierbar ist. 

IS 22. Datenverarbeitungsanordniing nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, dafi als 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
Logibl6cken vorgesehen sind. 

20 23. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, dalS jedem 
Zellelement ein eigenes KonfigurationsvorhaXtemittel zugeordnet ist. 

24. Datenvereurbeitungsanordnung nach einem der vorhergehenden 

25 Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, dafi die 

KonfigurationsvorhaXtemittel dazu ausgebiXdet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25. Datenvereurbeitungsanordnung nach einem der vorhergehenden 

30 Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, daS 

mehrere f est vorgegebene nichtf lUchtige Konf igurationen im 
Konfigurationsvorhaltexnittel vorgegeben sind. 

26. Datenverarbeitungsanordnimg nach einem der vorhergehenden 

35 DatenverarbeitungsanordnungsansprOche, dadurch gekeimzeichnet, dafi die 

Anordnung dazu ausgebiXdet ist, eine wechseXnde einer VieXzahX von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonfiguration Oder des Xokalen Sequencing. 

40 27. Datenveraucbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordn\mgsansp3Ctlche, dadiirch gekennzeichnet, dag bei 
einigen Zellen im Betrieb mit ver&ider lichen Konf igurationen versehbcure 
KonfigurationsvorhaXtemittel vorgesehen sind. 

45 28. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitiingsanordnungsansprUche, dadurch gekennzeichnet, daS als 
Konfigurationsvorhaltemittel z\xnmindest eines aus R0£{, EPHOH, EBPROM, 
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Flash- Speicher, Fuse-, Antifuse-prograimnierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur fest vorgesehene 
Speichexmittel gewShlt sind. 



5 29. Verfahren zur Hers t el lung einer dedizierten 

Datenverarbeitungsanordnxing, dadurch gekennzeichnet, da& ein 
multidimensionales Feld mit in Funktion und/oder Vemetzung 
konfigurierbaren zellelemente und diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konfigurations-Vorhalten 
10 vorgegeben wird, bestiinmt wird, welche Konfigurationen in diesen 

vorzuhalten sind, \md dann nichtf Itlchtige Konf igurationsvorhaltemittel 
so vorgesehen werden, daB sie zumindest einen Teil der vorgehaltenen 
Konfigurationen nichtf lUchtig vorhalten. 



15 30. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeichnet, dafi von einem zur lauf zeitrekonfigurierbaren 
multidiznensionalen Feld axisgegangen wird. 



31. Verfahren nach dem vorhergehenden Datenverarbeitimgsanordnungsanspruch, 
20 dadurch gekennzeichnet, da& zun^chst von einem zur 

lauf zeitrekonfigurierbaren multidimensionalen Feld rait 
Rekonfigurationsbeschaltung ausgegangen wird und dann fUr 
Rekonfiguration nichtbenOtigte Felder weggelassen werden. 

32. Datenverarbeitungsanordnimg, insbesondere nach einem der vorhergehenden 
25 AnsprUche, insbesondere Prozessor, mit einem Feld aus zur Laufzeit in 

Funktion und/oder Vemetzung datenverabeitenden rekonf igxirierbaren 
Zellen, denen Speicher und eine Seguenzersteuerung zugeordnet ist, 
dadurch gekennzeichnet, daB die Steuerung derart ausgebildet ist, daft 
sich ein vollstandiger und/oder limitierter Befehssatz ergibt. 



33. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden AnsprOche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vemetzung datenverabeitenden 

35 rekonf igurierbaren Zellen, mit einer ALU Oder anderen logischen 

Verkntipfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadiirch gekennzeichnet, da& der Speicher in 
einer anderen Halbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verkntipfungsbeschaltung angeordnet ist. 

40 

34, Datenverarbeittangsanordnung, insbesondere nach einem der 
vorhergehenden AnsprOche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion xind/oder Vemetzung datenverabeitenden 
rekonf igiirierbar en Zellen, von denen einige Speicher zwecken dienen, 

45 dadurch gekennzeichnet, dafi diese Zellen dazu ausgebildet sind, eine 

MMO und/oder DMA - Funktion zu realisieren. 
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35. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden AasprUche, insbesondere Prozessor, xnit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
5 rekonfigurierbaren Zellen, dadiirch gekeimzeichnet, dafi wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs/Ausgangs funktion realisieren iind bevorzugt 
zugleich eine ALU oder anderen logischen Ver3aitipfungsbeschaltung zur 
Datenverarbeitung und/oder -vertoderung aufweisen, wobei insbesondere 
10 Mittel vorgesehen sind, um jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 



36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorhergehenden AnsprUchei insbesondere Prozessor, mit einem Feld aus 

zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, daH zumindest 
einige, bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konfigurationseinheit zur schnellen Rekon figuration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafi die Konfigurationseinheit 
nur zur Konf ig\xration der grobgranularen tind/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 



38. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden Ansprtiche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenveralseitenden 

30 rekonfigurierbaren Zellen zur Verarbeitung von Daten mit einer h6heren 

Bitbreite, dadurch gekennzeichnet, daft die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer hfiheren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIUD-Rechenwerkes . 



39. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprtiche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, daS zur Zelle hin oder von dieser weg ftihrende Busse 

40 teilbar sind, insbesondere um mehrere Datenstrfime mit geringerer 

Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhdngig weiterleiten und/oder empfangen zu k6nnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 

45 vorhergehenden Ansprtiche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, daS die Busverwaltung lokal in der Zelle erfolgt. 
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41. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
AnsprUche, dadurch gekennzeichnet, daS einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und die Adressbusse als 
Teiladresbusse au£teilbar sind. 



42. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
AnsprUche/ dadurch gekennzeichnet, daS einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen 
10 ist, um bei Zugrif f auf eine Speicherstelle sowohl Informationen 

betreffend die Adresse einer Speicherstelle fOr den nachsten 
Speicherzugriff zu bestimmen als auch Daten und/oder Befehle zu 
ermitteln. 



15 



66 



wo 03/036507 PCT/EP02/10S72 

-1/18- 




wo 03/036507 



-2/18- 



PCT/EP02/10572 



0102a1 



blQ2 b 




CM 



O 
O 



l0102c 



T3 
CO 
O 



01 05a 
Q1Q3b 

j 0201 [ -1 
- 0202 - 



L- 0203 - 



m . .v^.w^v. i 01 05b 01 03c , 

cSI I ' ! — ^^ 0103a1 



CO 
CO 

o 



3i; 



(0 
CM 

■ ■■■ 

LL 



0104 



OlOaal 



miI2b 




0105a 



0 1Q 3 b 



ID 
CO 
O 



- 0201 n 



= 0202 



^ 0203 



0105b 0103c 



0104 



CO 
CO 

o 



X 



n 

CM 

d) 

■ ■■■ 

LL 

0103a1 



OlO^al 



|QlQ2b 




0105a 



CM 
CMt 

o 



.Q1Q3b 



ID 
CO 
O 



- 0201 n 



0202 



^ 0203 



|0Tg2c__ i 0105b 0103d K 



CO 

CO 

o 



U 
CM 

il 



^0103a1 



0104 



wo 03/036507 



-3/18- 



PCT/EP02/10572 




wo 03/036507 



-4/18- 



PCT/EP02/10572 



< 

D 



111 
CD 

g 

DC 
H 



O 
O 



< 



LO 

o 



tttt 



0406 



1 



CC 
LU 

O 

g 
cr 



00000(X)0 



0405 



CO 

o 

'nI- 

o 



oooooooo 



ooooocx?o 



oooooooo 



oooooooo 



o 
o 



oooooooo 



oooooooo 



► oooooooo 



► oooooooo 



CM 

o 
o 



oooooooo 
oooooooo 



oooooooo 



oooooooo 



jD 
LO 

o 



d) 

LL 



0408 

T 

o 
o 



Wp 03/036507 



-5/18- 



PCT/EP02/10572 




wo 03/036507 



-6/18- 



PCT/EP02/10572 




wo 03/036507 



-7/18- 



PCT/EP02/10572 




wo 03/036507 



-8/18- 



PCT/EP02/10572 




a 



0701 



wo 03/036507 



-9/18- 



PCT/EP02/10572 




wo 03/036507 



-10/18- 



PCT/EP02/10572 




CM CO 
CM CM 



1-1012 



-1011 



n 
o 



1024 


o o 

— 1 r" 


1025 








1024 


"T P- 


1025 









o 
o 

■ ■Hi 

u. 



wo 03/036507 



-11/18- 



PCT/EP02/10572 



—n 

A II 



US? 



08 



1102 

-J3 



A II T- 



^06 



A II T- 



o3 



t 



t g 11022 



CO 



\ 

I 




CVfCMCMCVIO^ 



111111 
I I 1 1 1 1 



CO 

o 

00 

,0 

o 



o 

z 

LU 



(D 



LU 

r 



/ 

i 1102 



CM 



o 

00 

o 



CD 



■ WW 

JQ 



r 



CD 



T1 1 32^ 

— r 



c 
ID 



o 

1131 

d) 

■■■■ 

u. 



3" 



08 



q 



2 1123 j5> 



03 

d) 
iL 



025 H 

— <Ki 

CM 



oe5 



06 



11 

A 



CM 



4M 
CM 



025 



ii 
A 



06 



<M 
CM 



c6 



O 



A 



wo 03/036507 



PCT/EP02/10572 




wo 03/036507 



-13/18- 



PCT/EP02/10572 




wo 03/036507 



-14/18- 



PCT/EP02/10572 



14") -j l Size Of Config n 

14121""^" 
SC(n±1) ^^4^3^ 

11433 



141 "I I Size Of Config 1 



0 



1412C 

SC2 



E 



^1413&& 



1433 

j4-|-| rsiziOfConfigO 

1433 1 41 2 1 

SCI 



^1413&& 



1415 



1414 



1 42 ^ ^Q*^"^^"^ ConfigTiT 

1433 



1 



1424" 



1 42 2^^*^*^^"^ ConfigT 



SCI 



1433 



^1423&& 



1 



1424' 



"1 42 2^"^"^^"^ Config"0 



SCO 



1 



1433 



-832331 



1424'.' 



1 461^ 



1402 



1409 



I 



1405 1404 



get 
^ — 



1401 



I 



1407 



1421 



Rusii 



14^26 



1403 



1406 



1416 



CM 
O 

+ 

T- 

o 

§ o 

II + 
o 



o 









CO 




o 


o 


o 


O 




O 



CO 
o 



wo 03/036507 



PCT/EP02/10572 



-15/18 



141 



1141 



■\ I Size Of Config n 



.1451. 



-] I Size Of Config 1 



a 



.1451 



|4-| "I I SizeOf ConflaO 

1403 * 1414 



1 4/^ 2^^'^'^^"^ Config n 



14i>2 



145X 

^17 



1 4^> 2^°'^'^^"^ Configl 



5 



145F 



1403 



Command Config 01 

y 14211 



in 

CO 



1439 



c CO 
cSCO 
O 



CO 



1 



3D 



•IV 



^1 



CO 
CO 



CO 

Li. u. 



00 
CO 



it 

CO 



O u 



I 



1437 



00 
CO 



CO 



I 



00 
CO 



CO 



CO 



1431 



wo 03/036507 



-16/18- 



PCT/EP02/10572 



o 



LO 

CD CO 





wo 03/036507 PCT/EP02/10572 

-17/18- 




wo 03/036507 



-18/18- 



PCT/EP02/10572 




